【问题标题】:Extract text from comlex captcha从复杂的验证码中提取文本
【发布时间】:2014-03-11 06:20:24
【问题描述】:

我需要解码这种验证码。 http://www0.xup.in/exec/ximg.php?fid=13934152

使用 ImageFilter 稍作修改后,ImageEnhance 看起来像这样。

http://www0.xup.in/exec/ximg.php?fid=32704628

但这距离被 Tesseract 认可还差得很远。

问题在于验证码不是静态的,因此所有的噪音和内容都会发生变化。

我想知道是否有更复杂的方法可以从中提取白色文本。更通用的东西。

【问题讨论】:

  • 您可以简单地编写一个小的预处理程序来迭代像素,如果像素(几乎)为白色,则将其变为黑色,如果不是,则将其变为白色。这应该是直截了当的。

标签: python captcha decode tesseract noise


【解决方案1】:

您可以绕过它,而不是尝试破解验证码。 mitmproxy 可以过滤和修改请求,因此您最终不会收到需要填写验证码的页面。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2017-09-29
    • 2022-08-19
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多