【发布时间】:2016-06-29 04:13:38
【问题描述】:
我使用 tesseract 引擎对我的图像进行 OCR,如下所示。 image1 to OCR image2 to OCR
我使用了 eng lang,并为引擎配置了一个白名单字符:“0123456789abcdefghijklmnopqrstuvwxyz”
pOCREngine->SetVariable("tessedit_char_whitelist", "0123456789abcdefghijklmnopqrstuvwxyz");
准确率不好,大概在10%左右。我试图用大约 200 张这样的图像来训练引擎,并将训练后的数据与 eng+mytrainedfont 结合起来。精度没有提高。
有没有人想改进此类图像的 OCR?提前致谢。
【问题讨论】: