【发布时间】:2018-05-22 15:07:02
【问题描述】:
我正在尝试从 Microsoft Word 文档中解析 Open XML。但是,每当我查看任何标签或属性时,我都会收到我想要的标签,前面是 openxmlformats 命名空间。下面的例子。有谁知道我如何删除它,只收到我的标签 ID 和值?
当前格式:
for content in root.iter():
print(content.tag)
返回:
'{http://schemas.openxmlformats.org/wordprocessingml/2006/main}tag'
和
for content in root.iter('{http://schemas.openxmlformats.org/wordprocessingml/2006/main}tag'):
print(content.attrib)
返回
'{http://schemas.openxmlformats.org/wordprocessingml/2006/main}val': 'Orange'
所需的输出:
for content in root.iter():
print(content.tag)
返回
tag
和
for content in root.iter('tag'):
print(content.attrib)
返回
val : 'Orange'
【问题讨论】:
-
添加一个为您执行此操作的包装函数。
标签: python lxml openxml elementtree