【问题标题】:How to implement an ordered, default dict?如何实现有序的默认字典?
【发布时间】:2017-04-04 13:46:51
【问题描述】:

我想将collections 中的OrderedDict()defaultdict() 组合在一个对象中,这应该是一个有序的,默认为dict
这可能吗?

【问题讨论】:

标签: python dictionary


【解决方案1】:

以下内容(使用 this recipe 的修改版本)对我有用:

from collections import OrderedDict, Callable

class DefaultOrderedDict(OrderedDict):
    # Source: http://stackoverflow.com/a/6190500/562769
    def __init__(self, default_factory=None, *a, **kw):
        if (default_factory is not None and
           not isinstance(default_factory, Callable)):
            raise TypeError('first argument must be callable')
        OrderedDict.__init__(self, *a, **kw)
        self.default_factory = default_factory

    def __getitem__(self, key):
        try:
            return OrderedDict.__getitem__(self, key)
        except KeyError:
            return self.__missing__(key)

    def __missing__(self, key):
        if self.default_factory is None:
            raise KeyError(key)
        self[key] = value = self.default_factory()
        return value

    def __reduce__(self):
        if self.default_factory is None:
            args = tuple()
        else:
            args = self.default_factory,
        return type(self), args, None, None, self.items()

    def copy(self):
        return self.__copy__()

    def __copy__(self):
        return type(self)(self.default_factory, self)

    def __deepcopy__(self, memo):
        import copy
        return type(self)(self.default_factory,
                          copy.deepcopy(self.items()))

    def __repr__(self):
        return 'OrderedDefaultDict(%s, %s)' % (self.default_factory,
                                               OrderedDict.__repr__(self))

【讨论】:

  • 删除了我的答案,这在思考过程中相似,但在运行中设计(因此需要实现各种其他功能)。
  • @Neil G:您可能应该只使用内置的callable() 函数来测试default_factory。使用isinstance(default_factory, Callable) 实际上需要它不仅仅是可调用性——参见docs——这就是这里所需要的。
  • @martineau:你是对的。我相信callable 已在 Python 3.1 中删除,然后在 Python 3.2 中恢复,并且在进行此编辑时我还没有升级。随意做出改变。
  • @Neil G:实际上callable() 在 Python 3.0 中首先被删除,然后在 Python 3.2 中被带回。无论如何,如果您愿意,请考虑自己更改(无论如何我更喜欢我自己的答案;-)。我通常倾向于回避只是跳入并更改其他人的答案,而是更喜欢像我在这里所做的那样只制作 cmets。
  • @zeekay:我认为您可能需要将self.items() 更改为iter(self.items()) 内的__reduce__。否则,会引发PicklingError 异常,抱怨__reduce__ 的第五个参数必须是迭代器。
【解决方案2】:

这是另一种可能性,灵感来自Raymond Hettinger's super() Considered Super,在 Python 2.7.X 和 3.4.X 上进行了测试:

from collections import OrderedDict, defaultdict

class OrderedDefaultDict(OrderedDict, defaultdict):
    def __init__(self, default_factory=None, *args, **kwargs):
        #in python3 you can omit the args to super
        super(OrderedDefaultDict, self).__init__(*args, **kwargs)
        self.default_factory = default_factory

如果您查看课程的 MRO(又名 help(OrderedDefaultDict)),您会看到:

class OrderedDefaultDict(collections.OrderedDict, collections.defaultdict)
 |  Method resolution order:
 |      OrderedDefaultDict
 |      collections.OrderedDict
 |      collections.defaultdict
 |      __builtin__.dict
 |      __builtin__.object

意思是当OrderedDefaultDict的一个实例被初始化时,它遵循OrderedDict的init,但是这个又会在调用__builtin__.dict之前调用defaultdict的方法,这正是我们想要。

【讨论】:

  • 这个答案,尽管它优雅和简单,但在 Python3 中不起作用。因为 OrderedDict 和 defaultdict 都是用 C 实现的,所以你会得到一个 TypeError,“多个基础有实例布局冲突”。这是因为 C 类在如何布置内部数据结构方面具有不同且不兼容的想法。上面接受的答案在 Python3 中运行良好,有一些微小的变化(super().__getitem__(... 而不是 OrderedDict.__getitem_(... )。我使用的是 Python3.5。
  • 有趣,这在 Python 3.4.3 中可以正常工作。有什么方法可以查看 C 代码中 TypeError 的来源?
  • 从 Python 3.6 开始,这将是不必要的,因为所有 dicts 以及所有 defaultdicts 都将被订购。我没关系,它不适用于 3.5 ;)
  • 虽然 CPython 3.6 中的 dicts 保留了顺序,但它是一个不可依赖的实现细节,请参阅 stackoverflow.com/a/39980548/91243。如果这是您想要的,请使用 OrderedDict
  • Guido 已经正式批准了。
【解决方案3】:

如果您想要一个不需要类的简单解决方案,您可以使用OrderedDict.<strong>setdefault</strong>(<em>key, default=None</em>)OrderedDict.<strong>get</strong>(<em>key, default=None</em>)。如果你只从几个地方获取/设置,比如在一个循环中,你可以轻松地设置默认值。

totals = collections.OrderedDict()

for i, x in some_generator():
    totals[i] = totals.get(i, 0) + x

setdefault 的列表更容易:

agglomerate = collections.OrderedDict()

for i, x in some_generator():
    agglomerate.setdefault(i, []).append(x)

但如果你多次使用它,最好设置一个类,就像在其他答案中一样。

【讨论】:

  • 这真的是最干净的答案!
【解决方案4】:

如果您的用例像我的一样简单,并且您不一定想将 DefaultOrderedDict 类实现的复杂性添加到您的代码中,这是另一个解决方案。

from collections import OrderedDict

keys = ['a', 'b', 'c']
items = [(key, None) for key in keys]
od = OrderedDict(items)

None 是我想要的默认值。)

请注意,如果您的要求之一是动态插入具有默认值的新键,则此解决方案将不起作用。简单性的权衡。

2017 年 3 月 13 日更新 - 我了解到这个用例的便利功能。与上面相同,但您可以省略 items = ... 行,只需:

od = OrderedDict.fromkeys(keys)

输出:

OrderedDict([('a', None), ('b', None), ('c', None)])

如果你的键是单个字符,你可以只传递一个字符串:

OrderedDict.fromkeys('abc')

这与上面两个示例的输出相同。

您还可以将默认值作为第二个参数传递给OrderedDict.fromkeys(...)

【讨论】:

  • 谢谢! od = OrderedDict((k, None) for k in iterable)
  • 这假设您的键是在某些可迭代中预定义的,因此下游对象需要注意添加新键需要初始值。更准确地说,您不能为以下内容假设初始值:&gt;&gt;&gt; od = OrderedDefaultDict(int) &gt;&gt;&gt; od['foo'] += 100 OrderedDefaultDict([('foo', 100)]) 这种情况可以由this one 之类的解决方案正确处理。
  • @avyfain 没错。对于我的用例,它只是初始数据,因此未来插入以前未定义的键是不相关的。我将添加一个注释以明确假设。
【解决方案5】:

另一种简单的方法是使用字典get 方法

>>> from collections import OrderedDict
>>> d = OrderedDict()
>>> d['key'] = d.get('key', 0) + 1
>>> d['key'] = d.get('key', 0) + 1
>>> d
OrderedDict([('key', 2)])
>>> 

【讨论】:

    【解决方案6】:

    @zeekay 答案的更简单版本是:

    from collections import OrderedDict
    
    class OrderedDefaultListDict(OrderedDict): #name according to default
        def __missing__(self, key):
            self[key] = value = [] #change to whatever default you want
            return value
    

    【讨论】:

    • 您甚至可以覆盖__init__ 来捕捉新项目的“default_factory”。
    【解决方案7】:

    一个基于@NickBread 的简单而优雅的解决方案。 有一个稍微不同的 API 来设置工厂,但好的默认值总是很好。

    class OrderedDefaultDict(OrderedDict):
        factory = list
    
        def __missing__(self, key):
            self[key] = value = self.factory()
            return value
    

    【讨论】:

      【解决方案8】:

      受此线程上其他答案的启发,您可以使用类似的东西,

      from collections import OrderedDict
      
      class OrderedDefaultDict(OrderedDict):
          def __missing__(self, key):
              value = OrderedDefaultDict()
              self[key] = value
              return value
      

      我想知道在 missing 方法中初始化同一类的另一个对象是否有任何缺点。

      【讨论】:

      • 这是一个有序的字典,默认值总是另一个有序的字典。不是真的问题是关于什么的。
      【解决方案9】:

      我测试了默认字典,发现它也已排序! 也许这只是一个巧合,但无论如何你都可以使用 sorted 函数:

      sorted(s.items())
      

      我觉得比较简单

      【讨论】:

      • sorted 可能与 OrderedDict 的插入顺序不同。
      猜你喜欢
      • 2011-06-29
      • 2019-04-26
      • 2016-08-26
      • 2022-12-09
      • 1970-01-01
      • 1970-01-01
      • 2016-01-28
      • 2011-05-04
      相关资源
      最近更新 更多