在python中的pandas中的DataFrame的dropna中的thresh
发布时间:2020-12-20 11:06:36 所属栏目:Python 来源:网络整理
导读:df1 = pd.DataFrame(np.arange(15).reshape(5,3))df1.iloc[:4,1] = np.nandf1.iloc[:2,2] = np.nandf1.dropna(thresh=1,axis=1) 似乎没有删除任何nan值. 0 1 20 0 NaN NaN1 3 NaN NaN2 6 NaN 8.03 9 NaN 11.04 12 13.0 14.0 如果我跑 df1.dropna(thresh=2,ax
df1 = pd.DataFrame(np.arange(15).reshape(5,3)) df1.iloc[:4,1] = np.nan df1.iloc[:2,2] = np.nan df1.dropna(thresh=1,axis=1) 似乎没有删除任何nan值. 0 1 2 0 0 NaN NaN 1 3 NaN NaN 2 6 NaN 8.0 3 9 NaN 11.0 4 12 13.0 14.0 如果我跑 df1.dropna(thresh=2,axis=1) 为什么它给出以下? 0 2 0 0 NaN 1 3 NaN 2 6 8.0 3 9 11.0 4 12 14.0 我只是不明白th??resh在这做什么.如果列具有多个nan值,是否应删除该列? 解决方法
thresh = N要求列具有至少N个非NaN才能存活.在第一个例子中,两列都至少有一个非NaN,因此两者都存活下来.在第二个示例中,只有最后一列至少有两个非NaN,因此它仍然存在,但前一列被删除.
尝试将thresh设置为4以更好地了解正在发生的事情. (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |