【发布时间】:2019-10-16 18:27:23
【问题描述】:
我正在开发一个项目,我正在评估 Scrapy 和 Apify。大多数代码都围绕着 node.js,所以一个 javascript 解决方案会很好。另外,我喜欢我可以在 Apify 中使用 puppeteer 的事实。也就是说,我的用例需要对许多网站进行相当浅的(例如大约 4 深度)爬网。这在 Scrapy 中很容易配置,但我不知道如何在 Apify 中进行配置。有没有办法在新的 Apify API 中指定最大深度?看起来这是他们旧版爬虫中的一个参数,但我在新 API 中没有找到它。
【问题讨论】:
标签: web-crawler apify