【发布时间】:2017-08-08 17:11:46
【问题描述】:
我正在尝试在带有 Python 2.7 的 Windows 7 中使用 pypdfocr。
这是我在cmd 中尝试pypdfocr 时收到的错误消息:
C:\Users\chamar.stu>pypdfocr F:\test2.pdf 开始转换 F:\test2.pdf 'pdfimages' 不被识别为内部或外部 命令、可运行的程序或批处理文件。警告:无法执行 pdfimages 来计算 DPI(尝试安装 xpdf 或 po ppler?),所以 默认为 300dpi Traceback(最近一次调用最后一次):文件 "c:\users\chamar.stu\appdata\local\continuum\anaconda2\lib\runpy.py", 第 174 行,在 _run_module_as_main .... ....
pypdfocr\pypdfocr_tesseract.py",第 98 行,在 _is_version_uptodate ver = [int(x) for x in ver_str.split('.')] ValueError: int() 以 10 为底的无效文字:'00alpha'
似乎我缺少Poppler 或XPDF,但我确实按照here 的建议通过PyGoObject 安装了Poppler。我还按照建议here 在我的环境路径中链接了xpdf。
有什么建议可以让我摆脱这个小麻烦吗?
【问题讨论】: