【发布时间】:2014-09-10 05:32:21
【问题描述】:
我正在使用 BeautifulSoup 对 XML 文件进行更改,但我注意到如果我读入文件,将其放入构造函数中,然后将其吐回而不对其进行任何更改,BeautifulSoup 已经做了一些代码的更改。例如,标签和属性名称都是小写的,标签中属性的顺序发生了变化。
实际上我知道这应该不是问题,但必须读取 XML 文件的程序非常挑剔,不会接受这些更改。我发现我可以在没有 BeautifulSoup 的情况下使用普通的字符串操作进行更改,但这很不方便。
有没有办法阻止 BeautifulSoup 在读取 XML 时对其进行更改?
【问题讨论】:
-
BeautifulSoup 是一个 HTML 解析器。不要在 XML 上使用它。
-
@minitech 不完全准确。 BS可以通过安装xml解析器库来进行XML解析——crummy.com/software/BeautifulSoup/bs4/doc/#installing-a-parser
-
包括您使用的代码、示例输入和预期输出。
标签: python xml xml-parsing beautifulsoup