【问题标题】:Tesseract ambiguity files work different for editingTesseract 歧义文件的编辑工作方式不同
【发布时间】:2016-04-27 08:49:53
【问题描述】:

我想编辑一些像 Female 和 Male 这样的文本,因为当我测试它们时,我发现它们是 FemaIe 和 MaIe(我的意思是 Capital I 不是小 L (l) )。我想使用类似 ambfile 来解决这个问题;

v1

6_tab_F_e_m_a_I_e_tab_6_tab_F_e_m_a_l_e_tab_1

4_tab_M_a_I_e_tab_4_tab_M_a_l_e_tab_1

但是当我重新测试我的结果时,结果更糟。我发现女性为 F,男性为 M。 我做错了什么?像这样使用 amb 文件是一个错误的想法吗?

【问题讨论】:

    标签: tesseract ambiguity training-data unichar


    【解决方案1】:

    根据Tesseract Training Wiki,字段应使用制表符分隔。

    【讨论】:

    • 是的.. 我不能在这里输入好,但我按照 wiki 中的说明进行操作(我希望编辑得更容易理解)。没有问题。我做了另一个测试,我可以使用 ambiguty ;除了这个问题。
    猜你喜欢
    • 1970-01-01
    • 2020-05-16
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-11-29
    • 1970-01-01
    • 2011-06-26
    相关资源
    最近更新 更多