python – 在pandas数据帧上同时操作groupby和resample?
发布时间:2020-12-16 22:42:38 所属栏目:Python 来源:网络整理
导读:我的pandas数据框由一个分类列JOB_TITLE,一个数字列BASE_SALARY和一个日期时间索引JOIN_DATE组成.我想对分类和下采样日期时间组进行聚合,如下所示: # Resampled at frequency of start data of every 5 yearsmean_agg = (df .groupby('JOB_TITLE') .resampl
我的pandas数据框由一个分类列JOB_TITLE,一个数字列BASE_SALARY和一个日期时间索引JOIN_DATE组成.我想对分类和下采样日期时间组进行聚合,如下所示:
不幸的是,由于groupby操作在重采样之前发生,因此对每个JOB_TITLE组独立地执行重采样操作.这导致以下系列:
正如您所看到的,Data Scientist组和软件工程师在JOIN_DATE级别的索引未对齐.当您为级别JOB_TITLE应用unstack时,这会产生一个问题,如下所示:
这导致以下数据帧:
如何避免groupby和resample的顺序操作,而是执行同步操作?谢谢! 最佳答案
更新Pandas 0.21回答:pd.TimeGrouper is getting deprecated,改用pd.Grouper.
我们尝试使用pd.TimeGrouper,而不是使用resample
TimeGrouper对齐分组时间范围的区间. (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |