《Python数据分析实战》6 pandas:数据处理
pd.merge(dat1,dat2,on=‘id‘):根据id合并 pd.merge(dat1,left_on=‘rid‘,right_on=‘sid‘):根据rid与sid合并 pd.merge(dat1,on=‘id‘,how=‘inner‘):内连接 pd.merge(dat1,how=‘left‘):左连接 pd.merge(dat1,how=‘right‘):右连接 pd.merge(dat1,how=‘outer‘):外连接 pd.merge(dat1,right_index=True,left_index=True):根据索引合并
pd.concat([srs1,srs2]):沿列拼接 pd.concat([srs1,srs2],axis=1):根据行index沿行拼接 pd.concat([dat1,dat2]):根据列index沿列拼接 pd.concat([dat1,dat2],axis=1)?:根据行index沿行拼接
pd.drop_duplicates(subset=[‘cone‘],keep=‘first‘):以对应列去重,保留第一个 pd.drop_duplicates(keep=‘last‘):以所有列去重,保留最后一个
srs.replace(np.nan,0):替换元素 dat.replace({0:1}):替换元素 dat[‘ctwo‘] = dat[‘cone‘].map({1:2,2:3,3:4}):新增映射列
srs2?= pd.cut(srs1,[0,0.2,0.5,1]):切割数值 srs2?= pd.cut(srs1,5):等距分组切割数值 srs2 = pd.qcut(srs1,5):等数分组切割数值
dat.describe()
dat.take(np.random.permutation(len(dat1))):随机排序 dat.take(np.random.randint(0,len(dat),size=3)):随机抽取
dat.groupby(‘cone‘).sum():根据列分组求和 dat.groupby(dat[‘cone‘]).sum():根据列分组求和 dat[‘cone‘].groupby(dat[‘ctwo‘]).sum():根据列分组求和(针对一列) for name,group in dat.groupby(‘cone‘)::分组迭代 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |