【发布时间】:2021-07-29 20:58:00
【问题描述】:
我正在编写一个 Python 网页抓取代码来抓取一个网站,这是该网站的链接 https://publicrecordsaccess.fultoncountyga.gov/Portal/Home/Dashboard/29
我正在使用 Selenium Web 驱动程序来执行此操作,但我正在尝试以一种不需要手动单击和绕过 reCAPTCHA 的方式自动化代码。我在 GitHub 上查看了一些在线代码,通过使用 Python 解决音频挑战来绕过它。但是当我这样做时,reCAPTCHA 会感觉到它并说我正在使用自动化软件。然后它会阻止我点击 reCAPTCHA。
我想知道是否有任何方法可以使用 Python Selenium Web 驱动程序绕过 reCAPTCHA?
谢谢!
【问题讨论】:
-
我的意思是,这就是验证码的意义所在。您可能很难找到可行的解决方案。
-
@Carcigenicate 我也这么认为。我觉得他们一直在更新 CAPTCHA 以防止我们绕过它。
-
@CodingStark 您“感觉”更新是为了防止我们绕过它,而您实际上是 100% 正确的。这就是更新的确切目的,使其更难被绕过。 CAPTCHA 代表“完全自动化的公共图灵测试,以区分计算机和人类”。您正在做的正是 CAPTCHA 旨在防止的事情。
-
@RandomDavis 这意味着基本上没有实际的解决方案吗?
-
@CodingStark 任何公开可用的解决方案都将由 CAPTCHA 开发人员查看,这意味着他们可以对其进行更新,以便该解决方案不再起作用。这是 CAPTCHA 开发人员和旁路开发人员之间不断进行的军备竞赛。网上有很多关于此的信息,甚至是特定于 Python 的信息;我确信有一些解决方案可以为你工作,或者至少让它更容易一些。如果我是你,我会做更多的研究。