【发布时间】:2017-10-16 11:19:33
【问题描述】:
我已经知道您可以将抓取配置为可恢复。
但是是否可以使用可恢复功能来暂停抓取过程,然后以编程方式在以后恢复抓取?例如。我可以优雅地shutdown使用爬虫的shutdown方法进行爬取,并将可恢复参数设置为true,然后重新开始爬取。
它会这样工作吗,因为 resumable 参数的主要目的是处理爬虫的意外崩溃。是否有任何其他或更好的方法可以使用 crawler4j 实现此功能?
【问题讨论】:
标签: java web-scraping web-crawler crawler4j