【问题标题】:tesseract training new fonts failtesseract 训练新字体失败
【发布时间】:2020-07-29 00:20:44
【问题描述】:

我能够安装 tesseract 并训练新字体

我已经完全按照http://michaeljaylissner.com/blog/adding-new-fonts-to-tesseract-3-ocr-engine 中提到的所有步骤进行操作

现在我正在测试训练数据,但运行命令时出现以下错误

tesseract eng.digital.exp0.tif ./output.txt -l eng

给我错误

Tesseract Open Source OCR Engine v3.03 with Leptonica
tessdata_manager.SeekToStart(TESSDATA_INTTEMP):Error:Assert failed:in file adaptmatch.cpp,    line 522
Abort trap: 6

现在,即使我尝试训练新数据,在此之后,我也会收到此错误, 我的意思是我现在无法运行以下命令

tesseract engg.digital.exp0.tif engg.digital.exp0.box nobatch box.train.stderr

我能够通过再次卸载并安装 tesseract 来解决此错误。 如果有更简单的方法来解决这个问题,你们能帮我吗?

提前致谢。

【问题讨论】:

    标签: tesseract


    【解决方案1】:

    好的,我已经修复了第二次运行失败。基本上我正在用英语训练另一种字体,我在原始 tessdata 文件夹中替换了 eng.traineddata。因此它失败了。我替换了原来的 eng.traineddata,现在可以重新训练了。

    【讨论】:

      【解决方案2】:

      我收到此错误是因为 .box 和 .tif 上的名称不匹配。在确保每对都有 language.fontName.countNumber.tif 和 language.fontName.countNumber.box 之后,它停止了在这个错误中崩溃。

      【讨论】:

        猜你喜欢
        • 2017-05-08
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2017-09-12
        • 2018-08-20
        相关资源
        最近更新 更多