python – 根据两列的值选择pandas帧行
发布时间:2020-12-16 23:31:05 所属栏目:Python 来源:网络整理
导读:我希望根据两个列值选择一些特定的行.例如: d = {'user' : [1.,2.,3.,4],'item' : [5.,6.,7.,8.],'f1' : [9.,16.,17.,18.],'f2':[4,5,6,5],'f3':[4,8]}df = pd.DataFrame(d)print dfOut: f1 f2 f3 item user0 9 4 4 5 11 16 5 5 6 22 17 6 5 7 33 18 5 8 8
我希望根据两个列值选择一些特定的行.例如:
d = {'user' : [1.,2.,3.,4],'item' : [5.,6.,7.,8.],'f1' : [9.,16.,17.,18.],'f2':[4,5,6,5],'f3':[4,8]} df = pd.DataFrame(d) print df Out: f1 f2 f3 item user 0 9 4 4 5 1 1 16 5 5 6 2 2 17 6 5 7 3 3 18 5 8 8 4 我想根据’user’和’item’的值选择行.给定一个存储[user,item]值对的2d numpy数组: samples = np.array([[1,[3,7],[2,6]]) Out: array([[1,6]]) 然后预期的输出是: Out: f1 f2 f3 item user 0 9 4 4 5 1 2 17 6 5 7 3 2 17 6 5 7 3 1 16 5 5 6 2 然后,我的最终目标是获得一个2d numpy数组存储除item和user之外的所有列值,即: Out: array([[9,4,[17,[16,5]]) 我们可以看到,它是列f1,f2,f3的值. 我怎样才能做到这一点? 解决方法
如果使用列user和item对DataFrame进行采样,则可以使用
inner join获取所需的值.默认情况下,pd.merge合并所有样本列并共享共享df – 在这种情况下,这将是用户和项目.因此,
result = pd.merge(samples,df,how='inner') 产量 user item f1 f2 f3 0 1 5 9 4 4 1 3 7 17 6 5 2 3 7 17 6 5 3 2 6 16 5 5 import numpy as np import pandas as pd d = {'user' : [1.,8]} df = pd.DataFrame(d) samples = np.array([[1,6]]) samples = pd.DataFrame(samples,columns=['user','item']) result = pd.merge(samples,how='inner') result = result[['f1','f2','f3']] result = result.values print(result) 产量 [[ 9. 4. 4.] [ 17. 6. 5.] [ 17. 6. 5.] [ 16. 5. 5.]] (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |