加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Python > 正文

Python解聚

发布时间:2020-12-16 22:27:34 所属栏目:Python 来源:网络整理
导读:我有一个汇总在两个日期之间的数据集,我想通过将总数与这些日期之间的天数相除来每日对其进行解聚. 作为样本 StoreID Date_Start Date_End Total_Number_of_sales78 12/04/2015 17/05/2015 7908980 12/04/2015 17/05/2015 79089 我想要的数据集是: StoreID

我有一个汇总在两个日期之间的数据集,我想通过将总数与这些日期之间的天数相除来每日对其进行解聚.
作为样本

StoreID Date_Start    Date_End     Total_Number_of_sales
78       12/04/2015    17/05/2015    79089
80       12/04/2015    17/05/2015    79089

我想要的数据集是:

StoreID Date         Number_Sales 
78         12/04/2015    79089/38(as there are 38 days in between)
78         13/04/2015    79089/38(as there are 38 days in between) 
78         14/04/2015    79089/38(as there are 38 days in between)
78         ...
78         17/05/2015    79089/38(as there are 38 days in between)

任何帮助都会有用.
谢谢

最佳答案
我不确定这是否正是你想要的,但你可以试试这个(我添加了另一个想象的行):

import datetime as dt
df = pd.DataFrame({'date_start':['12/04/2015','17/05/2015'],'date_end':['18/05/2015','10/06/2015'],'sales':[79089,1000]})

df['date_start'] = pd.to_datetime(df['date_start'],format='%d/%m/%Y')
df['date_end'] = pd.to_datetime(df['date_end'],format='%d/%m/%Y')
df['days_diff'] = (df['date_end'] - df['date_start']).dt.days


master_df = pd.DataFrame(None)
for row in df.index:
    new_df = pd.DataFrame(index=pd.date_range(start=df['date_start'].iloc[row],end = df['date_end'].iloc[row],freq='d'))
    new_df['number_sales'] = df['sales'].iloc[row] / df['days_diff'].iloc[row]
    master_df = pd.concat([master_df,new_df],axis=0)

首先将字符串日期转换为datetime对象(以便您可以计算范围之间的天数),然后根据日期范围创建新索引,并划分销售额.循环将数据帧的每一行粘贴到“扩展”数据帧中,然后将它们连接成一个主数据帧.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读