加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Python > 正文

python – 选择列列表中至少有一个值不为空的行

发布时间:2020-12-16 22:48:40 所属栏目:Python 来源:网络整理
导读:我有一个包含许多列的大型数据框(如1000).我有一个列列表(由脚本生成~10).我想选择原始数据框中的所有行,其中至少有一列我的列不为空. 所以如果我事先知道我的列数,我可以这样做: list_of_cols = ['col1',...]df[ df[list_of_cols[0]].notnull() | df[list_

我有一个包含许多列的大型数据框(如1000).我有一个列列表(由脚本生成~10).我想选择原始数据框中的所有行,其中至少有一列我的列不为空.

所以如果我事先知道我的列数,我可以这样做:

list_of_cols = ['col1',...]
df[
  df[list_of_cols[0]].notnull() |
  df[list_of_cols[1]].notnull() |
  ...
  df[list_of_cols[6]].notnull() |
]

我也可以遍历cols列表并创建一个掩码然后我将应用于df,但他看起来太乏味了.知道熊猫在处理nan方面有多强大,我希望有一种方法可以更轻松地实现我想要的东西.

最佳答案
在dropna()方法中使用thresh参数.通过设置thresh = 1,指定如果至少有1个非空项,则不要删除它.

df = pd.DataFrame(np.random.choice((1.,np.nan),(1000,1000),p=(.3,.7)))
list_of_cols = list(range(10))

df[list_of_cols].dropna(thresh=1).head()

enter image description here

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读