【发布时间】:2017-01-31 16:30:07
【问题描述】:
我有几个经过 OCR 处理的 PDF 文件(不是由我处理的)。它们包含扫描的图像和 OCR 文本。它们似乎在某些查看器(iPhone/iPad)中运行良好,但在其他查看器(macOS 上的 Preview.app)中运行良好,这使得它们阅读起来有些尴尬。
通过谷歌搜索,似乎文本和图像可能分层不正确或使用的字体有问题?我什至不确定我使用的词汇是否正确,因为我得到的大多数热门歌曲都毫无价值。
是否可以使用 ghostscript 或其他东西来批量修复这些文件?
【问题讨论】:
标签: pdf ocr ghostscript