【问题标题】:Frequency of elements in pairwise comparison of lists within a list in PythonPython中列表中列表的成对比较中元素的频率
【发布时间】:2020-10-13 03:20:43
【问题描述】:

我有一个这样的列表:

my_list_of_lists = 
[['sparrow','sparrow','sparrow','junco','jay','robin'],
['sparrow','sparrow','junco', 'sparrow','robin','robin'],
['sparrow','sparrow','sparrow','sparrow','jay','robin']]

我想对所有列表的每个位置进行成对比较,列表如下:

#1 with 2
['sparrow','sparrow','sparrow','junco','jay','robin']
['sparrow','sparrow','junco', 'sparrow','robin','robin']

#1 with 3
['sparrow','sparrow','sparrow','junco','jay','robin']
['sparrow','sparrow','sparrow','sparrow','jay','robin']

#2 with 3
['sparrow','sparrow','junco', 'sparrow','robin','robin']
['sparrow','sparrow','sparrow','sparrow','jay','robin']

所以 1 和 2 的对:

pairs =[('sparrow','sparrow'), ('sparrow','sparrow'), ('sparrow','junco'),('junco','sparrow'),('junco','junco'), ('jay','robin'), ('robin','robin')]

我想在每对比较中获得配对的计数和频率:

pairs =[('sparrow','sparrow'), ('sparrow','sparrow'), ('sparrow','junco'),('junco','sparrow') ('junco','junco'), ('jay','robin'), ('robin','robin')]

sparrowsparrow_counts = 2
juncosparrow_counts = 2
jayrobin_counts = 1
robinrobin = 1

frequency_of_combos = [('sparrow', 'sparrow'):.333, ('sparrow', 'junco'):.333, ('jay', 'robin'):.167, ('robin', 'robin'): .167]

我尝试过压缩,但我最终将所有列表(而不是对)压缩成元组,而我对其余部分感到困惑。

我认为它与How to calculate counts and frequencies for pairs in list of lists? 有点相关,但我不知道如何将其应用于我的数据。

【问题讨论】:

  • 你压缩了一对字典;使用collections.Counter 结构来计算对。除以总数。现在对三个列表对中的每一个重复此操作。
  • 感谢您的快速回复。为确保我正确理解您,我将创建这些列表的字典(即列表字典),然后使用 collections.Counter 为每个列表的每个成对比较计算对。除以总数会给我频率。至于重复,在完整的数据集中,我必须遍历大约 75 个这些列表,所以我会遍历字典。这是正确的解释吗?
  • 抱歉 -- 压缩三个 列表 中的一对,而不是新的字典。如果您有 75 个列表,那么我建议您使用 itertools.combinations(list_of_lists, 2) 生成列表配对。

标签: python list loops frequency pairwise


【解决方案1】:

压缩两个列表,然后过滤掉不匹配的对,并使用 collections.Counter 来统计它们:

from collections import Counter

a = ['sparrow','sparrow','sparrow','junco','jay','robin']
b = ['sparrow','sparrow','junco', 'sparrow','robin','robin']
c = Counter([ i for i in zip(a,b) if i[0] == i[1]])
print(c)


Counter({('sparrow', 'sparrow'): 2, ('robin', 'robin'): 1})

您似乎已经弄清楚了频率部分,但这应该可以清除 zip 和 Counter 的使用。

【讨论】:

    猜你喜欢
    • 2017-02-25
    • 1970-01-01
    • 1970-01-01
    • 2017-01-21
    • 2020-09-20
    • 1970-01-01
    • 1970-01-01
    • 2017-03-12
    相关资源
    最近更新 更多