【问题标题】:Tesseract unicharset_extractor command not found找不到 Tesseract unicharset_extractor 命令
【发布时间】:2016-04-10 22:52:52
【问题描述】:

我的问题

运行unicharset_extractor 并接收:

unicharset_extractor:找不到命令

我的环境

OSX El Capitan Version 10.11.4

Terminal Version 2.6.1 (361.1)

tesseract 3.04.00
 leptonica-1.73
  libgif 4.2.3 : libjpeg 9a : libpng 1.6.21 : libtiff 4.0.6 : zlib 1.2.8 : libwebp 0.5.0 : libopenjp2 2.1.0

类似问题

这个问题被问了很多,但似乎没有解决我的问题。此处列出了一些无效的问题:

unicharset_extractor: command not found

Adding New Fonts to Tesseract 3

Issue 1327 in tesseract-ocr: unicharset_extractor statement doesn´t work

我在做什么

我目前正在尝试训练我的tesseract-ocr 识别自定义数字。

我做了什么

我最初使用Homebrew安装tesseract,它安装了tesseractleptonica和其他依赖项到/usr/local/Cellar。我使用this 指南来帮助我训练数据。按照指南的指示,我首先生成了一组.tif 文件,格式为tla.test_font.exp[num].tif。然后我使用这个脚本生成了.box 文件:

for i in `seq 0 52`;
do
    tesseract tla.test_font.exp$i.tif tla.test_font.exp$i -l eng -psm 10 batch.nochop makebox
done

然后我通过 tesseract 运行 .box 文件:

for i in `seq 0 52`;
do
    tesseract tla.test_font.exp$i.tif tla.test_font.exp$i -l eng -psm 10 nobatch box.train
done

然后我尝试运行unicharset_extractor *.box 并收到上面的错误消息。

怀疑它与我的tesseract 安装路径有关,并且不想使用符号链接进一步搞砸事情,然后我从usr/local/Cellar 卸载了tesseractlibtoolleptonica,并使用了@ 987654327@ 重新安装一切。这次是/opt/local/bin。重复上述相同步骤后,我陷入了同样的问题。我什至尝试运行 man unicharset_extractor 并且手册页运行良好。

【问题讨论】:

    标签: bash path tesseract osx-elcapitan image-recognition


    【解决方案1】:

    在安装 tesseract 时,您尚未安装培训工具。现在您必须使用以下命令卸载 tesseract brew 卸载 tesseract 然后使用安装工具 brew install --with-training-tools tesseract

    在这之后你应该可以运行 unicharset_extractor 命令了。

    谢谢

    【讨论】:

    • 感谢您这么久后回答这个问题。我不再有正确的环境来验证您的答案。如果别人能确认你的答案是正确的,我会接受。
    【解决方案2】:

    尝试https://tesseract-ocr.github.io/tessdoc/Compiling.html 中指定的命令和步骤。按照这些步骤解决了我的问题。

    【讨论】:

      猜你喜欢
      • 2016-07-18
      • 1970-01-01
      • 2019-05-11
      • 2020-02-10
      • 2021-02-10
      • 1970-01-01
      相关资源
      最近更新 更多