【发布时间】:2019-07-01 03:10:19
【问题描述】:
当我跑步时
from xml.etree import ElementTree
tree = ElementTree.fromstring('<foo bar=""baz=""></foo>')
我明白了
xml.etree.ElementTree.ParseError: 格式不正确(无效标记):第 1 行,第 11 列
这是因为"" 和baz 之间没有空格。
我在第三方提供给我的 XML 文件中遇到了这个问题。
有什么方法可以让ElementTree 对间距不那么迂腐,并像有空格一样解析它?
【问题讨论】:
-
值得注意的是,这个类似问题中的解决方案会忽略错误,但不会恢复 baz 属性:stackoverflow.com/questions/13046240/…
-
我认为这是不可能的。 XML 在设计上是“迂腐的”。你所拥有的不是 XML,符合标准的解析器拒绝它是正确的。
-
如果我只是正则表达式这个问题,之后我会遇到 0 个问题吗?还是 2 个?
标签: python elementtree