转自 http://blog.csdn.net/u012150179/article/details/38226103

 

通过在settings.py中设置DEPTH_LIMIT的值可以限制爬取深度,这个深度是与start_urls中定义url的相对值。也就是相对 url的深度。例如定义url为:http://www.domz.com/game/,DEPTH_LIMIT=1那么限制爬取的只能是此url下一级 的网页。深度大于设置值的将被ignore。

如图:

【转】scrapy爬取深度设置

相关文章:

  • 2022-12-23
  • 2022-12-23
  • 2021-08-29
  • 2022-12-23
  • 2021-10-18
  • 2021-07-23
  • 2022-12-23
  • 2021-12-20
猜你喜欢
  • 2021-04-18
  • 2021-07-06
  • 2022-12-23
  • 2021-07-17
  • 2022-12-23
  • 2021-10-21
  • 2021-05-23
相关资源
相似解决方案