【问题标题】:Python-Counting element frequency in a 2D list [duplicate]二维列表中的Python计数元素频率[重复]
【发布时间】:2017-03-01 14:32:30
【问题描述】:

我想知道是否有一种方法可以计算 2D python 列表中的元素频率。 对于一维列表,我们可以使用

list.count(word)

但是如果我有一个列表呢:

a = [ ['hello', 'friends', 'its', 'mrpycharm'], 
      ['mrpycharm', 'it', 'is'], 
      ['its', 'mrpycharm'] ]

我能找到这个二维列表中每个单词的频率吗?

【问题讨论】:

    标签: python


    【解决方案1】:

    假设我明白你想要什么,

    >>> collections.Counter([x for sublist in a for x in sublist])
    Counter({'mrpycharm': 3, 'its': 2, 'friends': 1, 'is': 1, 'it': 1, 'hello': 1})
    

    或者,

    >>> c = collections.Counter()
    >>> for sublist in a:
    ...     c.update(sublist)
    ...
    >>> c
    Counter({'mrpycharm': 3, 'its': 2, 'friends': 1, 'is': 1, 'it': 1, 'hello': 1})
    

    【讨论】:

    • 你知道使用生成器表达式而不是列表推导式是否会导致加速吗? Counter(x for sublist in a for x in sublist)
    【解决方案2】:

    您可以使用defaultdict

    from collections import defaultdict
    d = defaultdict(int)
    for sublist in a:
        for word in sublist:
            d[word] += 1
    

    【讨论】:

    • @juanpa.arrivillaga 为什么收藏错了?
    • 看sberry的回答
    • 但这似乎也可以正常工作
    • @juanpa.arrivillaga:但这并不意味着它是错误的集合。
    • 不是错误的收藏,只是不同的选择。在 2.7 中引入它之前,这正是我会做的。对于它的价值,对于我的机器(和 CPython2.7)上的这种大小的数据,这个解决方案比使用 Counter 快 50% 以上。
    【解决方案3】:

    您已经知道list.count()。只需获取每个sublistsum 中的字数。例如:

    >>> my_word = 'its'
    >>> sum(sublist.count(my_word) for sublist in a)
    2
    

    如果您想要list 中出现的每个单词的频率,这里有很多很好的答案。或者,如果您想在没有任何import 的情况下执行此操作(使用普通的dict),您可以这样做:

    my_dict = {}
    for sublist in a:
        for item in sublist:
            if item not in my_dict:
                my_dict[item] = 0
            my_dict[item] += 1
    
    # Value of my_dict:
    {'friends': 1, 'is': 1, 'it': 1, 'its': 2, 'mrpycharm': 3, 'hello': 1}
    

    【讨论】:

      猜你喜欢
      • 2013-11-21
      • 2021-07-20
      • 1970-01-01
      • 2017-03-22
      • 1970-01-01
      • 2014-03-01
      • 1970-01-01
      • 2013-09-26
      相关资源
      最近更新 更多