【发布时间】:2013-11-11 09:05:30
【问题描述】:
大家晚上好,
我正在尝试使用在第一个示例中找到的 tesseract (OCR) python 包装器: https://code.google.com/p/python-tesseract/wiki/CodeSnippets
我在 Windows XP 机器上使用 Python27。一切都是 32 位的。
我已经安装了本指南中的所有依赖项: http://opencvpython.blogspot.com/2012/05/install-opencv-in-windows-for-python.html
我检查了环境变量: TESSDATA_PREFIX = C:\Program Files\Tesseract-OCR\tessdata\
最后,我尝试在 cmd.exe 中执行脚本: “python.exe 119.py”(119.py 是 CodeSnippets 中的第一个示例,具有不同的 c 图像),我收到以下错误:
C:\Python27>python.exe 119.py 打开数据文件 C:\Program Files\Tesseract-OCR\tessdatatessdata/eng.trai 时出错 内德数据 请确保将 TESSDATA_PREFIX 环境变量设置为父 d 您的“tessdata”目录的目录。 加载语言“eng”失败 Tesseract 无法加载任何语言!
现在,我在这里唯一注意到的是 eng.traineddata 之前的斜杠 (/) 而不是反斜杠 (\),这是在环境变量之后自动添加的位。 我希望这是唯一需要修复的东西,但我不知道如何去做,这就是我在这里的原因...... :)
所以,经验丰富的程序员,二进制之神,请帮助我。 提前致谢。 :)
附言
我需要为这个项目使用一台 Windows 机器,所以切换到 Linux 作为一种简单的方法在这里不是一个选择。 :(
【问题讨论】:
-
错误消息告诉您不要在路径中包含 tessdata 目录并显示带有“tessdatatessdata”的路径 - 它显然再次附加了路径。尝试将其从路径中删除。
-
天哪,我是不是已经筋疲力尽了...好吧,是的,显然...现在我只是在执行后不断遇到 python 崩溃,但我得到了一些输出(虽然是错误的)...谢谢输入,不敢相信我这么粗心... -.-
-
附注我如何在评论中投票给你? :))
标签: python windows ocr tesseract