加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Python > 正文

python – Pandas:重新采样后计算唯一值

发布时间:2020-12-16 23:54:15 所属栏目:Python 来源:网络整理
导读:我刚刚开始使用Pandas并尝试组合:按日期对数据进行分组,并计算每组中的唯一值. 这是我的数据: User,TypeDatetime2014-04-15 11:00:00,A,New2014-04-15 12:00:00,B,Returning2014-04-15 13:00:00,C,New2014-04-20 14:00:00,D,New2014-04-20 15:00:00,Return

我刚刚开始使用Pandas并尝试组合:按日期对数据进行分组,并计算每组中的唯一值.

这是我的数据:

                  User,Type
Datetime
2014-04-15 11:00:00,A,New
2014-04-15 12:00:00,B,Returning
2014-04-15 13:00:00,C,New
2014-04-20 14:00:00,D,New
2014-04-20 15:00:00,Returning
2014-04-20 16:00:00,Returning
2014-04-20 17:00:00,Returning

这就是我想要达到的目的:将日期时间索引重新采样到当天(我可以做),并计算每天的唯一用户.
我对“类型”专栏并不感兴趣.

Day,Unique Users
2014-04-15,3
2014-04-20,2

我正在尝试df.user.resample(‘D’,how =’count’).独特但它似乎没有给我正确的答案.

最佳答案
您无需进行重新取样即可在问题中获得所需的输出.我想你可以在约会时与一个小伙伴相处:

print df.groupby(df.index.date)['User'].nunique()

2014-04-15    3
2014-04-20    2
dtype: int64

然后,如果您愿意,您可以重新计算以在计算唯一身份用户后填写时间序列差距:

cnt = df.groupby(df.index.date)['User'].nunique()
cnt.index = cnt.index.to_datetime()
print cnt.resample('D')

2014-04-15     3
2014-04-16   NaN
2014-04-17   NaN
2014-04-18   NaN
2014-04-19   NaN
2014-04-20     2
Freq: D,dtype: float64

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读