【发布时间】:2017-03-19 17:31:45
【问题描述】:
我一直在尝试通过在 python 中使用 lxml 和 requests 包来解析 xml 和 html 页面。为此,我使用以下代码:
在python中:
import requests
import lxml.etree
url = ""
req = requests.get(url)
tree = html.fromstring(req.content)
root = tree.xpath('')
for item in root:
print(item.text)
此代码工作正常,但对于某些网页无法正确显示其内容并需要设置编码 utf-8 但我不知道如何在此代码中添加设置编码
【问题讨论】:
标签: python parsing encoding python-requests lxml