加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Python > 正文

python – 查找时间序列数据的总持续时间,不重叠

发布时间:2020-12-20 13:07:44 所属栏目:Python 来源:网络整理
导读:我有一个包含开始和结束时间戳的记录列表,如下所示: [{u'end_time': 1444197616.0,u'start_time': u'2015-10-07T05:59:58Z'},...] 这些时间段可以重叠,我无法弄清楚如何找到没有重叠的总持续时间.例如: BEGIN END03:00 03:0303:02 03:0503:04 03:0503:01 0
我有一个包含开始和结束时间戳的记录列表,如下所示:

[{u'end_time': 1444197616.0,u'start_time': u'2015-10-07T05:59:58Z'},...]

这些时间段可以重叠,我无法弄清楚如何找到没有重叠的总持续时间.例如:

BEGIN END
03:00 03:03
03:02 03:05
03:04 03:05
03:01 03:06
03:08 03:10

0 - 3
  2    -  5
      4 - 5
 1    -     6
               8 - 10

总计= 8分钟.

我想我可以通过找到差距来做到这一点,但是如何?

解决方法

我将解决常规浮动中的范围,它应该很容易延伸到日期时间……

让我们假设数据是[开始,结束]列表的序列.如果不是这种格式,您可以轻松地将其转换为此格式.

首先,我按开始时间对数据进行排序.这使事情变得更容易,因为您现在知道索引i 1的范围只能扩展索引i的范围,被索引i的范围所包含,或者它的开始是下一个折叠范围的开始.

接下来,我将查看当前索引和下一个索引的范围的开始和结束.如果下一个索引的开始位于当前范围内,则可以将其折叠为一个.继续这样做,直到下一个索引的开始不在当前范围内,然后产生当前范围.我认为应该看起来像这样:

def get_collapsed_ranges(ranges):
    ranges = iter(sorted(ranges))
    current_range = next(ranges)
    for start,end in ranges:
        if start > current_range[1]:
            yield current_range
            current_range = [start,end]
        elif end > current_range[1]:
            current_range[1] = end
    yield current_range

我没有对此进行过广泛的测试,但它至少适用于您的测试数据:

>>> list(get_collapsed_ranges([[0,3],[2,5],[4,[1,6],[8,10]]))
[[0,10]]

当然,从这里开始,要获得总持续时间,您可以将折叠范围内的差异和Bob的叔叔相加.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读