加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Python > 正文

python – 按多个键分组并汇总字典列表的值/平均值

发布时间:2020-12-20 10:31:37 所属栏目:Python 来源:网络整理
导读:什么是通过多个键进行分组的最 pythonic方法,并在 Python中汇总字典列表的平均值?假设我有一个字典列表如下: input = [{'dept': '001','sku': 'foo','transId': 'uniqueId1','qty': 100},{'dept': '001','sku': 'bar','transId': 'uniqueId2','qty': 200},
什么是通过多个键进行分组的最 pythonic方法,并在 Python中汇总字典列表的平均值?假设我有一个字典列表如下:

input = [
{'dept': '001','sku': 'foo','transId': 'uniqueId1','qty': 100},{'dept': '001','sku': 'bar','transId': 'uniqueId2','qty': 200},'transId': 'uniqueId3','qty': 300},{'dept': '002','sku': 'baz','transId': 'uniqueId4','qty': 400},'transId': 'uniqueId5','qty': 500},'sku': 'qux','transId': 'uniqueId6','qty': 600},{'dept': '003','transId': 'uniqueId7','qty': 700}
]

期望的聚合输出:

output=[
{'dept': '001','qty': 900},'qty': 700}
]

或平均:

output=[
{'dept': '001','avg': 200},'avg': 450},'avg': 600},'avg': 700}
]

我发现了这个:Group by and aggregate the values of a list of dictionaries in Python但它似乎没有给我我想要的东西.

解决方法

获得汇总结果

from itertools import groupby
from operator import itemgetter

grouper = itemgetter("dept","sku")
result = []
for key,grp in groupby(sorted(input_data,key = grouper),grouper):
    temp_dict = dict(zip(["dept","sku"],key))
    temp_dict["qty"] = sum(item["qty"] for item in grp)
    result.append(temp_dict)

from pprint import pprint
pprint(result)

产量

[{'dept': '001','qty': 200,'sku': 'bar'},'qty': 400,'sku': 'foo'},'qty': 900,'sku': 'baz'},'qty': 600,'sku': 'qux'},'qty': 700,'sku': 'foo'}]

要获得平均值,您可以简单地更改for循环内的内容,就像这样

temp_dict = dict(zip(["dept",key))
temp_list = [item["qty"] for item in grp]
temp_dict["avg"] = sum(temp_list) / len(temp_list)
result.append(temp_dict)

产量

[{'avg': 200,'dept': '001',{'avg': 200,{'avg': 450,'dept': '002',{'avg': 600,{'avg': 700,'dept': '003','sku': 'foo'}]

建议:无论如何,我会在这样的dict中添加qty和avg

temp_dict = dict(zip(["dept",key))
temp_list = [item["qty"] for item in grp]
temp_dict["qty"] = sum(temp_list)
temp_dict["avg"] = temp_dict["qty"] / len(temp_list)
result.append(temp_dict)

产量

[{'avg': 200,'sku': 'foo'}]

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读