【问题标题】:Summing up two lists of tuples on a condition在一个条件下总结两个元组列表
【发布时间】:2021-06-29 12:30:31
【问题描述】:

我们有两个长度可能不同的元组列表,如下所示:

list1 = [(15339456, 140), (15340320, 412), (15341184, 364), (15342048, 488),
         (15342912, 272), (15343776, 350), (15344640, 301), (15345504, 159),
         (15346368, 224), (15347232, 241), (15348096, 223), (15348960, 175)]


list2 = [(15339456, 1516), (15341184, 2046), (15342048, 2400), (15342912, 8370),
         (15343776, 2112), (15344640, 1441), (15345504, 784),  (15346368, 1391)]

每个元组的第一个元素是键并且在每个列表中是唯一的。我们不能假设密钥在两个列表中都存在。一个列表可以包含具有不在另一个列表中的键的元素。现在我们要总结元组的第二个值,如果它的键在两个列表中,否则我们取完整的元组。

结果:

[(15339456, 1656),
 (15340320, 412),
 (15341184, 2410),
 ...
]

通常使用zip 对列表进行汇总,例如:

for tup1, tup2 in zip(list1, list2):
    sum_ = tup1[1] + tup2[1]
    lst.append((tup1[0], sum_))

如果两个列表的长度相同并且每个键都存在于两个列表中,这将起作用,但情况并非如此。

在这个for 循环中建立条件有什么好的方法吗?或者可能是这个的pythonic解决方案?两个for 循环和元素比较似乎不太令人满意。

【问题讨论】:

  • 所以你首先会遍历一个列表,而不是另一个列表,然后检查它的内部是否都相加,否则插入?对我来说似乎很穷
  • @mkrieger1 为什么第一次迭代添加到一个空列表?但是,要总结第二个列表的值,我仍然需要检查键是否在结果中,我不知道有任何操作可以为我做这件事。
  • 如果每个列表中的每个键都是唯一的,则可以先将每个列表转换为字典,然后再应用stackoverflow.com/questions/11011756/…的解决方案。

标签: python list sum tuples


【解决方案1】:

一个明显的解决方案是创建一个结果字典,然后添加第一个列表中的所有值,然后添加第二个列表中的所有值:

from collections import defaultdict

result = defaultdict(int)
for key, value in list1:
    result[key] += value
for key, value in list2:
    result[key] += value

# convert dictionary-like to list of tuples if you want
result = list(result.items())

使用字典作为结果使您无需进行线性搜索以查找要添加值的键(导致整体二次复杂性),尤其是 defaultdict 使您无需这样做

if key not in result:
    result[key] = 0

在添加第一个值之前初始化结果。

您可以使用itertools.chain 将其推广到任意数量的输入列表:

from collections import defaultdict
from itertools import chain

input_lists = [list1, list2]

result = defaultdict(int)
for key, value in chain.from_iterable(input_lists):
    result[key] += value

从视觉上看,现在只有一个 for 循环,但实际上它在做同样的事情。

【讨论】:

  • 还有两个 for 循环。但是,条件很好地解决了,就像那个一样。
  • 如果键是一个字符串,比如哈希值,这个真的有用吗?
  • 是的,字符串可以用作字典键。
猜你喜欢
  • 2010-12-19
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2012-04-21
  • 2017-08-22
  • 1970-01-01
  • 1970-01-01
  • 2022-01-18
相关资源
最近更新 更多