【问题标题】:How to extract numbers and mathematical operator from a complex mathematical captcha如何从复杂的数学验证码中提取数字和数学运算符
【发布时间】:2019-11-27 10:03:17
【问题描述】:

我想使用 Python 自动访问使用此类验证码的网站。我尝试使用pytesseract,但没有任何结果。

【问题讨论】:

    标签: java captcha python-tesseract


    【解决方案1】:

    CAPTCHA(“完全自动化的公共图灵测试,以区分计算机和人类”)的目的正是让机器极其难以提取文本或视觉元素,而“正常”人类不应该有有什么麻烦。

    您可以采用多种方法绕过验证码,但请记住,验证码本身的一点点改进可能会导致绕过它的额外困难。

    您尝试读取的 CAPTCHA 无法使用标准 OCR 读取,否则 CAPTCHA 的目的本身就会失效。此外,它要求对提取的数据执行数学运算。操作本身可以随时更改。

    一开始,一些网站将他们的验证码解决方案托管在页面本身或图片地址中。如今,这种情况极为罕见。

    据我所知,解决此类 CAPTCHA 的最有效方法是依赖于完成这项工作的人员网络。我不确定这些网络的链接是否可以在 SO 中发布,但是一个简单的谷歌搜索就可以了。

    通常情况下,网络有一个客户端来提交图像,然后您会得到验证码的文本。根据网络的不同,您通过解决获得积分,并因询问验证码而失去积分。

    这可以自动化。请记住,现代验证码需要用户与验证码本身进行交互,以点击和拖放的形式进行,因此这些网络在这些情况下是无效的。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2011-06-25
      • 2017-03-18
      • 2020-04-18
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多