python 爬虫中文乱码 - 白发黄鸡

python 爬虫中文乱码

问题描述：

当我们直接爬虫国内网站时，中文会出现乱码

原因就是python 内部编码格式与我们爬虫的网站不一致。因为此时我们需要去目标网站先去看他的编码格式，如：

那么我们在python 解析时也要加上对应编码即可

rHtml = requests.get(link, headers=headers, timeout=20)
print(rHtml.status_code)
if (rHtml.status_code == 200):
rHtml.encoding = \'gb2312\'
    d = pq(rHtml.text)
    print(d)

2022-12-23
2021-12-25
2021-12-25
2021-12-25
2021-10-04
2021-05-28
2021-09-11