【发布时间】:2014-03-30 04:23:45
【问题描述】:
是否可以使用 ImageMagick 处理像 this 这样的图像,以便我可以使用 tesseract-ocr 将其转换为文本?
由于背景中的线条,我从传统方法中得到了废话。有谁知道如何处理这样的图像?
'convert -density 300 -units PixelsPerInch -type Grayscale +compress input.png input.tif' 后跟 'tesseract input.tif output -l eng' 给了我完全的垃圾。
或者我可以使用 ImageMagick 的任何替代方法来预处理此类图像,无论是通过命令行还是在 python 中?
【问题讨论】:
标签: image-processing imagemagick ocr tesseract