【发布时间】:2014-06-18 13:56:54
【问题描述】:
以下代码采用 XML 并将其转换为字典:
import xml.etree.cElementTree as et
tree = et.parse(path_to_xml)
root = tree.getroot()
xml_dict = etree_to_dict(root)
地点:
def etree_to_dict(t):
d = {t.tag: {} if t.attrib else None}
children = list(t)
if children:
dd = defaultdict(list)
for dc in map(etree_to_dict, children):
for k, v in dc.iteritems():
dd[k].append(v)
d = {t.tag: {k:v[0] if len(v) == 1 else v for k, v in dd.iteritems()}}
if t.attrib:
d[t.tag].update(('@' + k, v) for k, v in t.attrib.iteritems())
if t.text:
text = t.text.strip()
if children or t.attrib:
if text:
d[t.tag]['#text'] = text
else:
d[t.tag] = text
return d
但是,上面的函数返回一个无序字典。我希望它改为返回 ordered 字典。我不清楚如何替换一些 字典理解 和 defaultdict 调用。
输入示例如下:http://www.w3schools.com/xml/plant_catalog.xml
关于如何替换的任何想法
【问题讨论】:
-
字典,根据定义,在 python 中是未排序的。您可以通过已排序的元组列表模拟“已排序”字典,但会丢失快速索引。 Python 没有原生的有序映射等价物,它的字典被实现为哈希表。
-
谢谢@aruisdante,如有必要,我很乐意牺牲速度。
-
好吧,你可以在一个类中包装一个字典,该类有一个
sorted_items属性,该属性返回以下内容:sorted(self._dict.items(), key = lambda item : item[0])。 -
@aruisdante:如果插入顺序是可以接受的(而不是按键排序或其他),那么
collections.OrderedDict可能正是提问者所需要的。 -
sorted != insertion-ordered,所以我想OP必须澄清
标签: python xml dictionary elementtree xml.etree