加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Python > 正文

python – 在pandas中使用布尔数组索引对象的最惯用的方法是什

发布时间:2020-12-16 21:51:23 所属栏目:Python 来源:网络整理
导读:我特别在谈论Pandas版本0.11,因为我正忙着用.loc或.iloc替换我对.ix的使用.我喜欢这样一个事实,即区分.loc和.iloc会告诉我是打算按标签还是整数位置进行索引.我看到任何一个人都会接受一个布尔数组,但我想保持他们的使用纯粹,以清楚地传达我的意图. 最佳答案

我特别在谈论Pandas版本0.11,因为我正忙着用.loc或.iloc替换我对.ix的使用.我喜欢这样一个事实,即区分.loc和.iloc会告诉我是打算按标签还是整数位置进行索引.我看到任何一个人都会接受一个布尔数组,但我想保持他们的使用纯粹,以清楚地传达我的意图.

最佳答案
在11.0中,所有三种方法都有效,suggested in the docs的方式就是使用df [mask].然而,这不是在位置上完成的,而是纯粹使用标签,所以在我看来loc最能描述实际发生的事情.

更新:我在github上询问过这个问题,结论是df.iloc [msk]会在pandas 11.1中给出NotImplementedError(如果是整数索引掩码)或ValueError(如果是非整数索引).

In [1]: df = pd.DataFrame(range(5),list('ABCDE'),columns=['a'])

In [2]: mask = (df.a%2 == 0)

In [3]: mask
Out[3]:
A     True
B    False
C     True
D    False
E     True
Name: a,dtype: bool

In [4]: df[mask]
Out[4]:
   a
A  0
C  2
E  4

In [5]: df.loc[mask]
Out[5]:
   a
A  0
C  2
E  4

In [6]: df.iloc[mask]  # Due to this question,this will give a ValueError (in 11.1)
Out[6]:
   a
A  0
C  2
E  4

也许值得注意的是,如果你给了掩码整数索引,它会抛出一个错误:

mask.index = range(5)
df.iloc[mask]  # or any of the others
IndexingError: Unalignable boolean Series key provided

这表明iloc实际上没有实现,它使用label,因此当我们尝试这个时,11.1会抛出NotImplementedError.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读