【发布时间】:2019-11-27 10:03:17
【问题描述】:
【问题讨论】:
标签: java captcha python-tesseract
【问题讨论】:
标签: java captcha python-tesseract
CAPTCHA(“完全自动化的公共图灵测试,以区分计算机和人类”)的目的正是让机器极其难以提取文本或视觉元素,而“正常”人类不应该有有什么麻烦。
您可以采用多种方法绕过验证码,但请记住,验证码本身的一点点改进可能会导致绕过它的额外困难。
您尝试读取的 CAPTCHA 无法使用标准 OCR 读取,否则 CAPTCHA 的目的本身就会失效。此外,它要求对提取的数据执行数学运算。操作本身可以随时更改。
一开始,一些网站将他们的验证码解决方案托管在页面本身或图片地址中。如今,这种情况极为罕见。
据我所知,解决此类 CAPTCHA 的最有效方法是依赖于完成这项工作的人员网络。我不确定这些网络的链接是否可以在 SO 中发布,但是一个简单的谷歌搜索就可以了。
通常情况下,网络有一个客户端来提交图像,然后您会得到验证码的文本。根据网络的不同,您通过解决获得积分,并因询问验证码而失去积分。
这可以自动化。请记住,现代验证码需要用户与验证码本身进行交互,以点击和拖放的形式进行,因此这些网络在这些情况下是无效的。
【讨论】: