【问题标题】:python: iterating through a dictionary with list valuespython:遍历具有列表值的字典
【发布时间】:2013-08-19 19:49:26
【问题描述】:

给定一个列表字典,例如

d = {'1':[11,12], '2':[21,21]}

哪个更pythonic或更可取:

for k in d:
    for x in d[k]:
        # whatever with k, x

for k, dk in d.iteritems():
    for x in dk:
        # whatever with k, x

或者还有什么需要考虑的?

编辑,如果列表可能有用(例如,标准字典不保留顺序),这可能是合适的,尽管它要慢得多。

d2 = d.items()
for k in d2:
        for x in d2[1]:
            # whatever with k, x

【问题讨论】:

  • 我更喜欢第二种,但它们几乎同样清晰。
  • 为什么不用更多的 Pythonic 和列表推导?
  • @woofmeow 请澄清
  • 抱歉刚刚太忙了……@foosion 正在谈论类似于下面的 kelorecs 答案的内容,其中包含列表推导……虽然不太可读

标签: python python-2.7 dictionary iterator


【解决方案1】:

我考虑了几种方法:

import itertools

COLORED_THINGS = {'blue': ['sky', 'jeans', 'powerline insert mode'],
                  'yellow': ['sun', 'banana', 'phone book/monitor stand'],
                  'red': ['blood', 'tomato', 'test failure']}

def forloops():
    """ Nested for loops. """
    for color, things in COLORED_THINGS.items():
        for thing in things:
            pass

def iterator():
    """ Use itertools and list comprehension to construct iterator. """
    for color, thing in (
        itertools.chain.from_iterable(
            [itertools.product((k,), v) for k, v in COLORED_THINGS.items()])):
        pass

def iterator_gen():
    """ Use itertools and generator to construct iterator. """
    for color, thing in (
        itertools.chain.from_iterable(
            (itertools.product((k,), v) for k, v in COLORED_THINGS.items()))):
        pass

我使用 ipython 和memory_profiler 来测试性能:

>>> %timeit forloops()
1000000 loops, best of 3: 1.31 µs per loop

>>> %timeit iterator()
100000 loops, best of 3: 3.58 µs per loop

>>> %timeit iterator_gen()
100000 loops, best of 3: 3.91 µs per loop

>>> %memit -r 1000 forloops()
peak memory: 35.79 MiB, increment: 0.02 MiB

>>> %memit -r 1000 iterator()
peak memory: 35.79 MiB, increment: 0.00 MiB

>>> %memit -r 1000 iterator_gen()
peak memory: 35.79 MiB, increment: 0.00 MiB

如您所见,该方法对峰值内存使用没有明显影响,但嵌套的 for 循环在速度方面是无与伦比的(更不用说可读性了)。

【讨论】:

    【解决方案2】:

    我的 Brionius 代码结果:

             3 function calls in 0.173 seconds
    
       Ordered by: standard name
    
       ncalls  tottime  percall  cumtime  percall filename:lineno(function)
            1    0.000    0.000    0.173    0.173 <string>:1(<module>)
            1    0.173    0.173    0.173    0.173 speed.py:5(m1)
            1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Prof
    iler' objects}
    
    
             4 function calls in 0.185 seconds
    
       Ordered by: standard name
    
       ncalls  tottime  percall  cumtime  percall filename:lineno(function)
            1    0.000    0.000    0.185    0.185 <string>:1(<module>)
            1    0.185    0.185    0.185    0.185 speed.py:10(m2)
            1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Prof
    iler' objects}
            1    0.000    0.000    0.000    0.000 {method 'iteritems' of 'dict' obje
    cts}
    

    【讨论】:

      【解决方案3】:

      这是一个速度测试,为什么不呢:

      import random
      numEntries = 1000000
      d = dict(zip(range(numEntries), [random.sample(range(0, 100), 2) for x in range(numEntries)]))
      
      def m1(d):
          for k in d:
              for x in d[k]:
                  pass
      
      def m2(d):
          for k, dk in d.iteritems():
              for x in dk:
                  pass
      
      import cProfile
      
      cProfile.run('m1(d)')
      
      print
      
      cProfile.run('m2(d)')
      
      # Ran 3 trials:
      # m1: 0.205, 0.194, 0.193: average 0.197 s
      # m2: 0.176, 0.166, 0.173: average 0.172 s
      
      # Method 1 takes 15% more time than method 2
      

      cProfile 示例输出:

               3 function calls in 0.194 seconds
      
         Ordered by: standard name
      
         ncalls  tottime  percall  cumtime  percall filename:lineno(function)
              1    0.000    0.000    0.194    0.194 <string>:1(<module>)
              1    0.194    0.194    0.194    0.194 stackoverflow.py:7(m1)
              1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Profiler' objects}
      
      
      
               4 function calls in 0.179 seconds
      
         Ordered by: standard name
      
         ncalls  tottime  percall  cumtime  percall filename:lineno(function)
              1    0.000    0.000    0.179    0.179 <string>:1(<module>)
              1    0.179    0.179    0.179    0.179 stackoverflow.py:12(m2)
              1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Profiler' objects}
              1    0.000    0.000    0.000    0.000 {method 'iteritems' of 'dict' objects}
      

      【讨论】:

      • iteritems() 有点快,并且在它的名字中有'iter'。还有什么可以问的? :-)
      • 在我的机器上,使用您的代码,m1 得到 0.172,m2 得到 0.185。
      • 多么奇怪 - 我又试了几次,m1 在我的机器上持续花费大约 15% 的时间。 Python 2.7,英特尔 i5。
      • Python 2.7.2, i5, win 7. 很奇怪。我运行了您的确切代码,而不是缩进通行证。
      • 是的,我刚刚修复了缩进,但结果相同。
      【解决方案4】:

      这是列表理解方法。嵌套...

      r = [[i for i in d[x]] for x in d.keys()]
      print r
      
      [[11, 12], [21, 21]]
      

      【讨论】:

      • 对于类似的事情,d.items() 似乎更好,至少对我而言,尤其是如果您想同时使用键和值。
      • 嗯,对.. 我真的不知道你的用例是什么。您要求@woofmeow 澄清列表理解。
      • 不用担心。我想我真正要问的是列表理解如何响应一个(如编辑的)想要对键和值做某事的问题。
      猜你喜欢
      • 1970-01-01
      • 2019-01-11
      • 2017-09-11
      • 2016-06-22
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2012-07-04
      相关资源
      最近更新 更多