【问题标题】:How to keep escape characters in xml text with BeautifulSoup如何使用 BeautifulSoup 在 xml 文本中保留转义字符
【发布时间】:2021-03-17 20:56:03
【问题描述】:

我正在使用 BeautifulSoup 处理 xml 文档。我需要维护标签字符串的所有转义字符,但是 BeautifulSoup 将转义字符转换为特殊字符。

如果我使用以下字符串创建一个 BeautifulSoup 对象

<mytext>
            &lt;p&gt;MyText&lt;/p&gt;
</myext>

并使用 .text 属性将文本从标签中取出,我在字符串下方

<p>MyText</p&>

但我需要保持字符串的原始形式。如何停止 BeautifulSoup 处理这些特殊字符?

【问题讨论】:

    标签: python beautifulsoup


    【解决方案1】:

    我能够通过使用来保留 html 实体表示法

    soup.prettify(formatter='html')
    

    str(soup)
    

    符号。

    认为其他人可能需要此信息。

    【讨论】:

      猜你喜欢
      • 2018-11-25
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2013-08-08
      • 1970-01-01
      • 1970-01-01
      • 2010-11-12
      • 1970-01-01
      相关资源
      最近更新 更多