【发布时间】:2014-05-03 23:52:15
【问题描述】:
我一直在尝试使用普通的 tesseract 3 OCR,使用不同的选项从字母表中获取数据,我的学生将其中一个字母标记为多项选择题的答案,如下所示:
最好的输出之一是:
EEEEEEEEEEEEEEEEEEEEEEEEE
DDDDDDDDDDDDDDDDDDDDDDDDD
CCCCCCCCCCCCCCCCCCCCCCCCC
BBBBBBBEBBBBBBBBBBBBBBBBB
AAAAAAAAAAAAAAAAAAAAAAAAA
6789012345678901234567890
2222333333333344444444445
EEEEE EEEE EE EEE EEEEEEE
DDDDDD DDD DDDDDDDDDDDD
CCCCCCCCCCCCCCCCCC CCCCC
B BEBE BB BBBBBBBBBBBBBBB
AA AAA AAAAA AAAAAAAA
1234567890123455789012345
OOOOOOOOO1111111111222222
我知道我可以解析该 .txt 文件并获得更好的结果,但它遗漏了很多信息并从一些绘制的块中获取了字母。
我想知道我能做些什么来获得更好的结果。
我还希望有一个表格,其中绘制的块显示为不同的字符,例如,对于图像的第一行和第二行:
01 A B C - E 26 A B C D E
02 A - C D E 27 A B C D E
如果你们有类似的经验,任何信息将不胜感激! 提前致谢!
【问题讨论】:
-
似乎绘制的字符被tesseract输出为空格,不是吗?您现在唯一的问题是,似乎只有一个空间可容纳任意数量的连续绘制块。它也将 6 误认为 5,但这很容易修复,除此之外它似乎工作得很好。您是否尝试过训练它以将绘制的块解释为“-”?这可能行得通。
-
正如我所说,我只尝试过普通的tesseract。我对它对矩阵的转座感到有点害怕,哈哈!但你认为适当的训练会奏效吗? (我仍然不知道如何训练 tesseract)有什么地方可以开始吗?类似的例子?谢谢!
-
训练 Tesseract 的说明可以在这里找到code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3,但我不确定从你的图像训练有多容易,我看到它与 .tiff 文件一起使用。
标签: image-processing ocr tesseract image-recognition pattern-recognition