【发布时间】:2020-09-15 14:23:19
【问题描述】:
我有一个虚拟的 xml 文件,
<?xml version="1.0" encoding="UTF-8"?>
<hello xmlns="abc">
<inside>
<ok>xyz</ok>
</inside>
</hello>
<?xml version="1.0" encoding="UTF-8"?>
<xyz xmlns="acxd">
</xyz>
<?xml version="1.0" encoding="UTF-8"?>
<zz xmlns="zmrt">
</zz>
]]>]]>
我正在尝试使用以下代码解析这个 xml 文件。
import xml.etree.ElementTree as ET
mytree = ET.parse(temp_xml)
我得到的错误是"ParseError: junk after document element: line 7, column 0"。
我确实尝试删除']]>]]>',即在第 7 行,但我仍然收到相同的错误,即"ParseError: junk after document element: line 8, column 0"。有没有办法处理这样的错误,或者我们可以跳过阅读这些有垃圾数据的行?
【问题讨论】:
-
我对 XML 不是很熟悉,但是你可以在一个文件中包含多个文档吗?
-
@JammyDodger:你足够熟悉,可以正确地怀疑这个问题。格式良好的 XML 文档中可能只存在一个根元素。有关详细信息,请参阅my answer below。