今天学习pyquery 读取HTML文件时,报错

pyquery 读取HTML报错UnicodeDecodeError: 'gbk' codec can't decode byte 0xaf in position 78: illegal multibyte sequence

这是字符编码错误,读取的时候不能读取gbk格式的字符

pyquery 读取HTML报错UnicodeDecodeError: 'gbk' codec can't decode byte 0xaf in position 78: illegal multibyte sequence

然后打开HTML文档,发现里面有中文字符,将中文字符去掉之后就可以执行了。

 

pyquery 读取HTML报错UnicodeDecodeError: 'gbk' codec can't decode byte 0xaf in position 78: illegal multibyte sequence

 

相关文章: