【发布时间】:2014-03-11 06:20:24
【问题描述】:
我需要解码这种验证码。 http://www0.xup.in/exec/ximg.php?fid=13934152
使用 ImageFilter 稍作修改后,ImageEnhance 看起来像这样。
http://www0.xup.in/exec/ximg.php?fid=32704628
但这距离被 Tesseract 认可还差得很远。
问题在于验证码不是静态的,因此所有的噪音和内容都会发生变化。
我想知道是否有更复杂的方法可以从中提取白色文本。更通用的东西。
【问题讨论】:
-
您可以简单地编写一个小的预处理程序来迭代像素,如果像素(几乎)为白色,则将其变为黑色,如果不是,则将其变为白色。这应该是直截了当的。
标签: python captcha decode tesseract noise