【发布时间】:2012-10-04 02:53:37
【问题描述】:
我已经成功地训练了 tesseract 2.x 来识别一些特定的字体。但是,似乎我无法让 tesseract 同时识别所有这些字体——即源图像包含所有这些字体。目前只能将一组 tesseract 数据放入 tessdata 文件夹(即一组具有一种训练好的字体)。
我知道 tesseract 3.x 可以正确处理多种字体 - 但是,我无法升级,因为没有与 .NET 的良好绑定,它与 2.x 版的 .NET 绑定具有相同的功能。
另外,我想避免对每种字体进行多次预处理和 OCR 本身。
【问题讨论】: