【发布时间】:2019-07-27 20:36:28
【问题描述】:
我正在使用 scrapy 抓取一些网页。但在某些时候,谷歌 reCAPTCHA 会挡道。
如果浏览器(在这种情况下为scrapy)没有运行的 javascript,Google reCAPTCHA 甚至不会加载。它只是要求您启用您的 javascript 来查看和解决 reCAPTCHA。
所以,我认为,如果我能找到一种方法在它发生时向用户显示这个 reCAPTCHA,用户可以手动解决这个问题,scrapy 会继续爬行,但我无法用真正的 javascript 中断这个过程.此时我可以使用什么?是否可以将硒与刮痧混合?
【问题讨论】:
-
reCATCHA 是网站通知您它不想被废弃的最终方式。
-
@akshaypatil 有什么理由将普通文本标记为代码示例?我已恢复更改。继续前进,请保重。
-
而不是专注于我们希望您回答的问题..@DebanjanB
-
blog.scrapinghub.com/2015/03/02/… 我找到了这个库。我还没有尝试过,但它可能很有用。
标签: python selenium scrapy recaptcha