【发布时间】:2018-02-15 05:45:50
【问题描述】:
所以我正在使用 BeautifulSoup。它让我得到了一些 HTML 节点的文本,但这些节点有一些 Unicode 字符,这些字符被转换为字符串中的转义序列
例如,一个具有以下内容的 HTML 元素:
50 € 由 BeautifulSoup 检索,例如:
soup.find("h2").text 作为这个字符串:50\u20ac,它只能在 Python 控制台中读取。
但是当写入 JSON 文件时,它变得不可读。
注意:我使用以下代码保存到 json:
with open('file.json', 'w') as fp:
json.dump(fileToSave, fp)
如何将这些 Unicode 字符转换回 UTF-8 或任何使它们再次可读的东西?
【问题讨论】:
-
你试过了吗:f = open('somefile', 'wb') 然后 f.write('your text')
-
保存到 JSON 是什么意思?您是将 JSON 返回给其他函数还是将其写入文件?
-
@chad 写入 JSON 文件。
-
提供minimal reproducible example。 如何将其保存为 JSON?显示字符串内容的
repr()。
标签: python json unicode utf-8 beautifulsoup