【问题标题】:Sorting child elements with lxml based on attribute value根据属性值使用lxml对子元素进行排序
【发布时间】:2016-03-15 17:54:06
【问题描述】:

我正在尝试根据属性值对文档中的一些子元素进行排序,虽然实际的排序功能似乎在工作,但新排序的元素的拼接似乎并没有。

from lxml import etree

def getkey(elem):
    # Used for sorting elements by @LIN.
    # returns a tuple of ints from the exploded @LIN value
    # '1.0' -> (1,0)
    # '1.0.1' -> (1,0,1)
    return tuple([int(x) for x in elem.get('LIN').split('.')])

xml_str = """<Interface>
                <Header></Header>
                <PurchaseOrder>
                    <LineItems>
                        <Line LIN="2.0"></Line>
                        <Line LIN="3.0"></Line>
                        <Line LIN="1.0"></Line>
                    </LineItems>
                </PurchaseOrder>
            </Interface>"""

root = etree.fromstring(xml_str)
lines = root.findall("PurchaseOrder/LineItems/Line")
lines[:] = sorted(lines, key=getkey)
res_lines = [x.get('LIN') for x in lines]
print res_lines

print etree.tostring(root, pretty_print=True)

当我执行上面的代码时,我会看到lines 列表确实排序正确,因为它打印了['1.0', '2.0', '3.0']。但是 XML 树没有更新,因为 tostring() 打印出以下内容。

<Interface>
  <Header/>
  <PurchaseOrder>
    <LineItems>
      <Line LIN="2.0"/>
      <Line LIN="3.0"/>
      <Line LIN="1.0"/>
    </LineItems>
  </PurchaseOrder>
</Interface>

我从http://effbot.org/zone/element-sort.htm 中得到了如何排序的想法,它说拼接应该是我更新元素顺序所需的全部,但似乎并非如此。我意识到 lxml 与 elementtree 不是 100% 兼容,因此作为健全性检查,我用 elementtree 替换了 lxml 导入并得到了完全相同的结果。

【问题讨论】:

    标签: python xml sorting lxml


    【解决方案1】:

    这将对输出进行排序和写入:

    import xml.etree.ElementTree as ET
    
    tree = ET.parse("in.xml")
    
    def getkey(elem):
        # Used for sorting elements by @LIN.
        # returns a tuple of ints from the exploded @LIN value
        # '1.0' -> (1,0)
        # '1.0.1' -> (1,0,1)
        return float(elem.get('LIN'))
    
    container = tree.find("PurchaseOrder/LineItems")
    
    container[:] = sorted(container, key=getkey)
    
    tree.write("new.xml")
    

    或者使用自己的代码打印:

    import xml.etree.ElementTree as ET
    
    tree = ET.fromstring(xml_str)
    
    def getkey(elem):
        # Used for sorting elements by @LIN.
        # returns a tuple of ints from the exploded @LIN value
        # '1.0' -> (1,0)
        # '1.0.1' -> (1,0,1)
        return float(elem.get('LIN'))
    
    root = etree.fromstring(xml_str)
    lines = root.find("PurchaseOrder/LineItems")
    lines[:] = sorted(lines, key=getkey)
    

    输出:

    In [12]: print (etree.tostring(root, pretty_print=True))
            <Interface>
                <Header/>
                    <PurchaseOrder>
                        <LineItems>
                            <Line LIN="1.0"/>
                        <Line LIN="2.0"/>
                            <Line LIN="3.0"/>
                            </LineItems>
                    </PurchaseOrder>
                </Interface>
    

    键是root.find("PurchaseOrder/LineItems"),你想找到LineItems 元素并对其进行排序。

    【讨论】:

    • 啊,当然可以。我天真地认为,既然它是一个引用列表,它会神奇地以某种方式调整顺序,但是我现在看到这个想法是多么愚蠢。谢谢。
    猜你喜欢
    • 2016-03-02
    • 1970-01-01
    • 1970-01-01
    • 2012-10-01
    • 1970-01-01
    • 2015-02-02
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多