【发布时间】:2014-01-14 21:05:17
【问题描述】:
根据this thread,我正在使用xml.dom.minidom 进行一些非常基本的XML 遍历,只读。
让我感到困惑的是,为什么它的getElementsByTagName 会在没有明确提供确切路径的情况下找到几个层次结构级别的节点。
XML:
<data>
<items>
<item name="item1"></item>
<item name="item2"></item>
<item name="item3"></item>
<item name="item4"></item>
</items>
<secondSetOfItems>
<item name="item5"></item>
<item name="item6"></item>
<item name="item7"></item>
<item name="item8"></item>
</secondSetOfItems>
</data>
Python 代码:
xmldoc = minidom.parse('sampleXML.xml')
items = xmldoc.getElementsByTagName('item')
for item in items:
print item.attributes['name'].value
打印:
item1
item2
item3
item4
item5
item6
item7
item8
困扰我的是它隐式地在data->items 和data->secondSetOfItems 下找到名为item 的标签。
如何使其遵循明确的路径并仅提取两个类别之一下的项目?例如。 data->secondSetOfItems下:
item5
item6
item7
item8
【问题讨论】: