【问题标题】:tesseract command not working from command line in windowstesseract 命令在 Windows 的命令行中不起作用
【发布时间】:2017-08-19 20:27:02
【问题描述】:

我为 windows 安装了 tesseract-OCR,它位于我系统的 C:\Program Files\Tesseract-OCR 路径中。

我通过在 PATH 变量中添加 C:\Program Files\Tesseract-OCR 来设置环境变量。

我还在系统变量中将 TESSDATA_PREFIX 设置为与上述 tesseract 相同的位置。

不过,当我尝试运行命令“tesseract some path\image.tif somepath\output”时,它给出的消息是“'tesseract' 未被识别为内部或外部命令”。

当我从安装 tesseract 的位置运行相同的命令时,它工作正常,但我需要在环境变量中设置它,因为它还允许 PYOCR 包装器识别它。

PYOCR 当前将“pyocr.get_available_tools()[0]”作为空列表。

非常感谢任何帮助。

【问题讨论】:

    标签: python tesseract python-tesseract


    【解决方案1】:

    也许我的回答有点晚了,但我会给出我的设置,它似乎在几分钟内就可以工作。和你一样,我使用的是 PYOCR 库,一开始我在使用 pyocr.get_available_tools() 时得到一个空列表。

    我在 Windows 10 笔记本电脑上运行它。

    首先,我从这里安装了 Tesseract 在 alpha 版本 4 中: https://github.com/UB-Mannheim/tesseract/wiki 然后在我的 Windows 用户 PATH 变量中添加位置。从这里,运行一个新命令行并检查是否检测到tesseract 工具,如果没有,则说明您的环境配置不正确!

    然后,我使用简单的pip pyocr 安装 PyOCR 并使用以下导入 在使用pyocr函数之前:

    import pyocr
    import pyocr.builders
    

    编辑: 我查看了 PYOCR 的当前源文件,发现了这个:

    def is_available():
        _set_environment()
        return util.is_on_path(TESSERACT_CMD)
    

    PyOCR 只是在你的 os Path 变量中寻找 tesseract.exe,所以我认为你只需要解决提到的问题,它就会起作用。

    编辑 2: 我用 UB Mannheim 版本更新了下载链接。似乎对我的数据更有效率。另外,我降级到 Tesseract 3,因为 4.0 alpha 版本不支持很多标志。

    希望对你有帮助 最好的问候

    【讨论】:

    • 在您的回答中,您假设在安装 tesseract 后,可以从命令行运行 tesseract,但在最初的问题中,即使他设置了 PATH 变量和基本上做了你所做的一切。
    • 嗨 Dmitrii,正如 Abhilash Kumar 所说,他的命令行工具似乎无法识别 Tesseract => 不过,当我尝试运行 [...] 外部命令时。我只是尝试给出帮助 PyOCR 在我的设置中识别 Tesseract 的基本步骤。有时你会尝试很多事情并忽略简单的事情。不确定这会解决他的问题。编辑:看看我的编辑,我认为 Path env var 会解决他的问题问题
    【解决方案2】:

    请检查 Tesseract-OCR 的正确安装路径。设置正确的路径,即C:\Program Files (x86)\Tesseract-OCR 为我工作。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2013-01-24
      • 2019-01-26
      • 1970-01-01
      • 2013-11-20
      • 2015-03-31
      相关资源
      最近更新 更多