【问题标题】:Sort nodes after using getElementsByTagName by the nodes attributes使用 getElementsByTagName 后按节点属性对节点进行排序
【发布时间】:2011-08-09 19:20:36
【问题描述】:

编辑

字典是这里的罪犯,这个问题上标记的答案有效,但字典做了它想要的。在这种情况下,对字典进行排序是答案,但现在我知道如何通过属性对节点进行排序,你也知道了。

结束

我很高兴向 Python 提问,这就是我所拥有的:

def parse_fixed_data(self, format):
    return_message = {}
    nodes = format.getElementsByTagName('data')
    for node in nodes:
        return_message[node.attributes['name'].value] = self.raw_message[int(node.attributes['from'].value):int(node.attributes['to'].value)] 
    return return_message

这几乎可以完美地工作。 “格式”变量是一个已经解析的节点,其中包含一堆“数据”节点。这是xml:

<pmbmsg id='pmb_header'>
    <version maj='01' min='00' rev='0000' type='FIXED' delimeter=''>
        <data seq='1'   from='0'   to='3'    name='message_type'/>
        <data seq='2'   from='3'   to='13'   name='version'/>
        <data seq='3'   from='13'  to='33'   name='from_system'/>
        <data seq='4'   from='33'  to='53'   name='to_system'/>
        <data seq='5'   from='53'  to='73'   name='family'/>
        <data seq='6'   from='73'  to='83'   name='priority'/>
        <data seq='7'   from='83'  to='103'  name='msg_format_id'/>
        <data seq='8'   from='103' to='135'  name='msg_unique_id'/>
        <data seq='9'   from='135' to='161'  name='created'/>
        <data seq='10'  from='161' to='163'  name='hop_count'/>
        <data seq='11'  from='163' to='173'  name='original_msg_format_id'/>
        <data seq='12'  from='173' to='205'  name='original_unique_id'/>
        <data seq='13'  from='205' to='245'  name='padding'/>
        <data seq='14'  from='245' to='4086' name='message_data'/>
    </version>
</pmbmsg>

好吧,这一切都很好,但我按此顺序恢复了字典元素:

u'to_system'            
u'padding'          
u'original_msg_format_id'   
u'original_unique_id'       
u'family'           
u'created'          
u'msg_format_id'        
u'hop_count'            
u'msg_unique_id'            
u'priority'         
u'version'          
u'from_system'          
u'message_type'         
u'message_data'

(删除的值)

我希望它们按照它们在 xml 中出现的顺序返回,并且 seq 属性可以对此有所帮助。在 Python 代码中的这一行之后:

nodes = format.getElementsByTagName('data')

...有一些我可以在节点上运行的功能来排序吗?或者在获取节点时我可以说些什么让它知道对它们进行排序?您会认为它会自然而然地按照 xml 的写入顺序获取它吗?

如果没有自动为我执行此操作的功能,我可以处理它。

【问题讨论】:

  • 您需要按值对字典进行排序。看看这里。 stackoverflow.com/questions/613183/…。或者不要使用字典。
  • 我的字典里没有序列号的空间。我的问题是关于按属性对节点进行排序,而不是对字典进行排序,这很容易,如果迫在眉睫,我会破解一些东西来做到这一点,但我想知道你是否可以从 getElementsByTagName 排序节点,而不是字典。
  • @KacieHouser 一眼看去,我以为它们没有排序是因为字典。我使用元素树来满足我的 python xml 需求。我不确定 dom 实现是如何工作的。
  • @eat_a_lemon 元素树有我要找的功能吗?
  • @KacieHouser 我相当肯定元素树将按照它们在文档中的顺序返回值

标签: python sorting attributes minidom


【解决方案1】:

节点不按 XML 中的名称排序,这也反映在节点列表中。它们将以与它们被迭代的顺序相同的顺序出现。根据定义,列表是有序的。字典不是。您遇到的问题是,当您迭代字典键时,您的属性名称是乱序的,并且没有办法绕过对字典进行排序。

您可以在处理字典之前对节点进行排序(这仍然不能保证字典本身会被排序):

>>> [node.attributes['name'].value for node in sorted(nodes, key=lambda x: x.attributes['name'].value)]
[u'created', u'family', u'from_system', u'hop_count', 
u'message_data', u'message_type', u'msg_format_id', u'msg_unique_id', 
u'original_msg_format_id', u'original_unique_id', u'padding', u'priority', 
u'to_system', u'version']

或者您可以使用collections.OrderedDict(在Python 2.7+ 中可用)而不是普通字典来创建return_message

# No example because I don't have acces to Python 2.7

或者您可以使用sorted()按值对字典进行排序。

>>> import operator
>>> sorted_return_message = sorted(return_message.iteritems(), key=operator.itemgetter(0))
>>> for k,v in sorted_return_message: print k
... 
created
family
from_system
hop_count
message_data
message_type
msg_format_id
msg_unique_id
original_msg_format_id
original_unique_id
padding
priority
to_system
version

或者您可以在运行时对键进行排序:

>>> for k in sorted(return_message):
...     print k
... 
created
family
from_system
hop_count
message_data
message_type
msg_format_id
msg_unique_id
original_msg_format_id
original_unique_id
padding
priority
to_system
version

【讨论】:

  • 我实际上希望它们按 'seq' 属性排序,但这足以让我得到我需要的东西。谢谢,很高兴知道 dict 可能有自己的想法。你会认为 dict 会将第一个 key => value assignment 放在顶部,第二个放在它下面,依此类推,我们将看到。
  • 是的,一开始可能会令人困惑,但这就是他们在 Python 2.7 中添加 OrderedDict 对象的原因。来自diveintopython.org “字典没有元素之间顺序的概念。说元素“无序”是不正确的;它们只是无序的。这是一个重要的区别,当你想访问元素时会惹恼你以特定的、可重复的顺序(如按键的字母顺序)。有一些方法可以做到这一点,它们只是没有内置到字典中。”
  • HA 我刚刚读到,字典是罪魁祸首,不过你的代码很聪明,我可能会觉得它很有用,谢谢你的帮助 :)
【解决方案2】:

从 Python 2.7 开始,OrderedDict 是一个新特性

【讨论】:

  • 我正在像 2.4 一样运行,而且我要订购的不是字典,我没有在字典中订购的钥匙。我想按属性对 xml 中的节点进行排序。
猜你喜欢
  • 2013-08-30
  • 1970-01-01
  • 1970-01-01
  • 2016-07-03
  • 1970-01-01
  • 2021-03-23
  • 1970-01-01
  • 1970-01-01
  • 2011-05-04
相关资源
最近更新 更多