pandas数据处理

发布时间：2020-12-14 03:16:35 所属栏目：大数据来源：网络整理

导读：pandas是python非常重要的数据处理库，pandas提供了非常丰富的数据处理函数，对机器学习，数据挖掘前的数据预处理很有帮助。以下是最近小的使用总结： 1、pandas读取了csv文件获取了Dataframe类型对象，该对象可以丰富的执行数据处理。缺失值处理dropna()

以下是最近小的使用总结：

groupdf=df.groupby(df['key1'])
    for name,group in groupdf:
        print group  # 分完组的小组 dataframe类型对象
        # print name # name 是分组的关键字

原始数据

分组后的数据

这里写图片描述

如果用reindex重建索引的数据，可以发现索引改变后值丢失了

这里写图片描述

解决重建索引方法：

# dataframe重建索引 
 group=group.reset_index(drop=True) 
 group=pd.DataFrame(group)

这里写图片描述

参考文献：简书，博客

（编辑：李大同）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!