问题描述:

在抓取网页内容时,利用requests,bs4等均能在结果中看到我想要的某字段,但是使用pyquery提取时却没有了

python 使用pyquery提取字段遇到的一个坑

python 使用pyquery提取字段遇到的一个坑

检查后不是编码的问题(结果中有正常显示的汉字),也不是xhtml和html的问题

发现问题:

打开网页源代码,检索“尾页”,发现含有此字段的代码被注释了!!!

python 使用pyquery提取字段遇到的一个坑

解决办法:

被注释代码提取出来,再利用pyquery转化并提取,就可以了。

 

 

 

相关文章: