最近在开始学习scrapy爬虫,遇到了一处很坑的地方,在屏幕上输出的debug信息总是没有任何结果就直接提示:

 [scrapy.statscollectors] INFO: Dumping Scrapy stats

...............

.............

[scrapy.core.engine] INFO: Spider closed (finished),然后程序就结束了

网上查了许久,才发现自己的错误:在parse()函数中的yield scrapy.Request()函数中参数传错了,错误的代码如下:

scrapy爬虫错误一:无法爬到期望的数据

正确的代码如下:

scrapy爬虫错误一:无法爬到期望的数据

还有可能是没有添加浏览器代理导致的,在setting.py文件添加下面的代码:

USER_AGENT = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_8_3) \
            AppleWebKit/536.5 (KHTML, like Gecko) Chrome/19.0.1084.54 Safari/536.5'

USER_AGENT的值可以更换

 

相关文章:

  • 2022-12-23
  • 2021-10-04
  • 2021-07-19
  • 2022-01-16
  • 2021-11-19
猜你喜欢
  • 2021-11-19
  • 2021-08-11
  • 2022-12-23
  • 2021-07-08
  • 2021-09-06
  • 2021-05-16
相关资源
相似解决方案