【发布时间】:2016-04-10 22:52:52
【问题描述】:
我的问题
运行unicharset_extractor 并接收:
unicharset_extractor:找不到命令
我的环境
OSX El Capitan Version 10.11.4
Terminal Version 2.6.1 (361.1)
tesseract 3.04.00
leptonica-1.73
libgif 4.2.3 : libjpeg 9a : libpng 1.6.21 : libtiff 4.0.6 : zlib 1.2.8 : libwebp 0.5.0 : libopenjp2 2.1.0
类似问题
这个问题被问了很多,但似乎没有解决我的问题。此处列出了一些无效的问题:
unicharset_extractor: command not found
Adding New Fonts to Tesseract 3
Issue 1327 in tesseract-ocr: unicharset_extractor statement doesn´t work
我在做什么
我目前正在尝试训练我的tesseract-ocr 识别自定义数字。
我做了什么
我最初使用Homebrew安装tesseract,它安装了tesseract、leptonica和其他依赖项到/usr/local/Cellar。我使用this 指南来帮助我训练数据。按照指南的指示,我首先生成了一组.tif 文件,格式为tla.test_font.exp[num].tif。然后我使用这个脚本生成了.box 文件:
for i in `seq 0 52`;
do
tesseract tla.test_font.exp$i.tif tla.test_font.exp$i -l eng -psm 10 batch.nochop makebox
done
然后我通过 tesseract 运行 .box 文件:
for i in `seq 0 52`;
do
tesseract tla.test_font.exp$i.tif tla.test_font.exp$i -l eng -psm 10 nobatch box.train
done
然后我尝试运行unicharset_extractor *.box 并收到上面的错误消息。
怀疑它与我的tesseract 安装路径有关,并且不想使用符号链接进一步搞砸事情,然后我从usr/local/Cellar 卸载了tesseract、libtool 和leptonica,并使用了@ 987654327@ 重新安装一切。这次是/opt/local/bin。重复上述相同步骤后,我陷入了同样的问题。我什至尝试运行 man unicharset_extractor 并且手册页运行良好。
【问题讨论】:
标签: bash path tesseract osx-elcapitan image-recognition