【发布时间】:2017-09-12 19:15:43
【问题描述】:
在抓取网站的单个页面时,我使用 Beautiful Soup 取得了巨大的成功,但我有一个新项目,我必须在其中检查大量网站,看看它们是否包含提及或指向我的网站的链接。因此,我需要检查每个站点的整个站点。
对于 BS,我只是还不知道如何告诉我的爬虫它是通过一个站点完成的,所以我达到了递归限制。这是 Scrapy 开箱即用的东西吗?
【问题讨论】:
标签: python web-scraping beautifulsoup scrapy