【发布时间】:2012-05-11 15:25:36
【问题描述】:
我想找到一种方法来获取元素树的所有子元素,就像 ElementTree.getchildren() 所做的那样,因为自 Python 2.7 版以来不推荐使用 getchildren()。
我不想再用了,虽然我现在还能用。
【问题讨论】:
标签: python xml elementtree
我想找到一种方法来获取元素树的所有子元素,就像 ElementTree.getchildren() 所做的那样,因为自 Python 2.7 版以来不推荐使用 getchildren()。
我不想再用了,虽然我现在还能用。
【问题讨论】:
标签: python xml elementtree
elem 的所有子元素(后代):
all_descendants = list(elem.iter())
一个更完整的例子:
>>> import xml.etree.ElementTree as ET
>>> a = ET.Element('a')
>>> b = ET.SubElement(a, 'b')
>>> c = ET.SubElement(a, 'c')
>>> d = ET.SubElement(a, 'd')
>>> e = ET.SubElement(b, 'e')
>>> f = ET.SubElement(d, 'f')
>>> g = ET.SubElement(d, 'g')
>>> [elem.tag for elem in a.iter()]
['a', 'b', 'e', 'c', 'd', 'f', 'g']
排除根本身:
>>> [elem.tag for elem in a.iter() if elem is not a]
['b', 'e', 'c', 'd', 'f', 'g']
【讨论】:
iter()。该元素的行为也像一个列表;所以,你也可以索引子元素。
getchildren() 也只返回直系子级。新的list(elem.iter()) 的旧等价物是list(elem.getiterator())。这取决于史蒂文真正想要什么。
在 pydoc 中提到在节点上使用 list() 方法来获取子元素。list(elem)
【讨论】:
如果要获取所有元素'a',可以使用:
a_lst = list(elem.iter('a'))
如果elem 也是'a',它将被包括在内。
【讨论】:
也许这与 OP 实际问题不对应,但从更广泛的意义上说,我建议如果有人想要获得以特定名称命名的所有元素,例如'object' 可以使用(@Turtles Are Cute 的替代方法至少在我看来更自然):
objs = tree.findall('object')
它也返回一个列表。
【讨论】:
现有答案都不会找到所有孩子。此解决方案使用 BeautifulSoup 而不是 ETree,但会找到所有子级,而不仅仅是顶级:
from bs4 import BeautifulSoup
with open(filename) as f:
soup = BeautifulSoup(f, 'xml')
results = soup.find_all('element_name')
【讨论】: