【问题标题】:Tesseract OCR, Python and Windows XP正方体 OCR、Python 和 Windows XP
【发布时间】:2013-11-11 09:05:30
【问题描述】:

大家晚上好,

我正在尝试使用在第一个示例中找到的 tesseract (OCR) python 包装器: https://code.google.com/p/python-tesseract/wiki/CodeSnippets

我在 Windows XP 机器上使用 Python27。一切都是 32 位的。

我已经安装了本指南中的所有依赖项: http://opencvpython.blogspot.com/2012/05/install-opencv-in-windows-for-python.html

我检查了环境变量: TESSDATA_PREFIX = C:\Program Files\Tesseract-OCR\tessdata\

最后,我尝试在 cmd.exe 中执行脚本: “python.exe 119.py”(119.py 是 CodeSnippets 中的第一个示例,具有不同的 c 图像),我收到以下错误:

C:\Python27>python.exe 119.py 打开数据文件 C:\Program Files\Tesseract-OCR\tessdatatessdata/eng.trai 时出错 内德数据 请确保将 TESSDATA_PREFIX 环境变量设置为父 d 您的“tessdata”目录的目录。 加载语言“eng”失败 Tesseract 无法加载任何语言!

现在,我在这里唯一注意到的是 eng.traineddata 之前的斜杠 (/) 而不是反斜杠 (\),这是在环境变量之后自动添加的位。 我希望这是唯一需要修复的东西,但我不知道如何去做,这就是我在这里的原因...... :)

所以,经验丰富的程序员,二进制之神,请帮助我。 提前致谢。 :)

附言

我需要为这个项目使用一台 Windows 机器,所以切换到 Linux 作为一种简单的方法在这里不是一个选择。 :(

【问题讨论】:

  • 错误消息告诉您不要在路径中包含 tessdata 目录并显示带有“tessdatatessdata”的路径 - 它显然再次附加了路径。尝试将其从路径中删除。
  • 天哪,我是不是已经筋疲力尽了...好吧,是的,显然...现在我只是在执行后不断遇到 python 崩溃,但我得到了一些输出(虽然是错误的)...谢谢输入,不敢相信我这么粗心... -.-
  • 附注我如何在评论中投票给你? :))

标签: python windows ocr tesseract


【解决方案1】:

我得到了同样的错误,在我通过这个命令在 cmd 中设置后,它被接受了。

set TESSDATA_PREFIX=C:/Program Files (x86)/Tesseract-OCR/tessdata

即使 Windows 接受反斜杠,您也需要使用正斜杠。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2012-08-10
    • 2015-04-21
    • 2013-02-08
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多