【问题标题】:tesseract output is in single line instead of multiple linestesseract 输出是单行而不是多行
【发布时间】:2017-12-21 00:05:52
【问题描述】:

我尝试使用tesseract进行ocr,识别很好。

我想从信件中识别地址。当我读到它时,会发生以下情况:

输入:

Name Name Street Code City

输出: 名称名称街道代码城市

我尝试了所有 -psm 变体,但没有任何效果。谷歌搜索后,我认为 -psm 4 是正确的,但我收到一个错误:

`set_count == gridheight():Error:Assert failed:in file ..\..\textord\colfind.cpp, on line 648`

此效果仅在 Windows 上出现 - 在我的 macbook 上,这些行是正确的。 有人可以帮帮我吗?

【问题讨论】:

    标签: tesseract


    【解决方案1】:

    使用 Unix2dos 将文件转换为正确的格式。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2016-04-18
      • 2014-03-02
      • 1970-01-01
      • 1970-01-01
      • 2021-12-05
      • 1970-01-01
      相关资源
      最近更新 更多