最近挺多人问起南航的验证码怎么识别,https://b2c.csair.com/ita/rest/intl/captcha/challenge?type=ac
南航验证码识别方案
看起来好像挺常规的,不过多刷新几次
南航验证码识别方案
可以看到其实字体变化挺多,而且坑的地方在于,字体相似度挺高,其次【字符边缘粘结】,这种粘接匹配度刚刚好,对于LSTM的特征提取挺不友好的其实,实际图片宽大于200,而一般情况网上的开源验证码识别的代码的backbone基本都是精简的VGG,3-5层CNN堆叠结构,不少使用MCG的朋友用了好几万样本训练许久发现识别率还是0,可以调整传入图片的尺寸,稍加变形更有利于这种图片的特征提取。笔者配置的参数如下:
南航验证码识别方案
还有一点,笔者做了二值预处理,阈值220。
最终朋友测试说识别率大约在94%,速度依旧是2-3ms。

总结:有时候图片训练效果不好可以试试调参大法,不一定要迷恋原始尺寸。

感兴趣的可以加群: 857149419
小编QQ:27009583

相关文章:

猜你喜欢
  • 2021-08-08
  • 2021-12-01
  • 2021-11-18
  • 2021-08-15
相关资源
相似解决方案