如何在没有迭代的情况下基于Pandas中的2个条件创建新的df.column

发布时间：2020-12-20 13:45:05 所属栏目：Python 来源：网络整理

导读：我有正常的df A = pd.DataFrame([[1,5,2],[2,4,4],[3,3,1],[4,2,[5,1,4]],columns=['A','B','C'],index=[1,5]) 如果我想根据另一列中的条件创建一个列,我会做这样的事情,并按预期工作. In [5]: A['D'] = A['C'] 2 In [6]: A Out[6]: A B C D1 1 5 2 False2 2

我有正常的df

A = pd.DataFrame([[1,5,2],[2,4,4],[3,3,1],[4,2,[5,1,4]],columns=['A','B','C'],index=[1,5])

如果我想根据另一列中的条件创建一个列,我会做这样的事情,并按预期工作.

In [5]: A['D'] = A['C'] > 2
 In [6]: A
 Out[6]: 
   A  B  C      D
1  1  5  2  False
2  2  4  4   True
3  3  3  1  False
4  4  2  2  False
5  5  1  4   True

但是,如果我想使用两个条件做同样的事情……比如：

A['D'] = A['C'] > 2 and A['B'] > 2      or     A['D'] = A['C'] > 2 & A['B'] > 2

我臭名昭着

ValueError: The truth value of a Series is ambiguous. Use a.empty,a.bool(),a.item(),a.any() or a.all().

如何在没有迭代的情况下解决？基于两个条件创建此新列的目的是能够使用类型的groupby函数：

A.groupby('D').apply(custom_fuction)

所以,也许有一种方法可以使用groupby来完成整个过程,但我不知道该怎么做.

谢谢

解决方法

使用&,not和,执行元素逻辑和操作：

In [40]: A['D'] = (A['C'] > 2) & (A['B'] > 2)

In [41]: A
Out[41]: 
   A  B  C      D
1  1  5  2  False
2  2  4  4   True
3  3  3  1  False
4  4  2  2  False
5  5  1  4  False

您也可以跳过定义D列：

In [42]: A.groupby((A['C'] > 2) & (A['B'] > 2))
Out[42]: <pandas.core.groupby.DataFrameGroupBy object at 0xab5b6ac>

（编辑：李大同）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!