更改图像 DPI 以与 tesseract 一起使用答案

【问题标题】：Changing image DPI for usage with tesseract更改图像 DPI 以与 tesseract 一起使用
【发布时间】：2017-10-21 02:19:15
【问题描述】：

我正在做一个项目来识别名片中的文本并将它们映射到适当的字段。我正在使用 opencv 进行图像处理。我需要将预处理后的图像提供给 Tesseract-OCR 引擎进行文本识别。This link 声明图像的 DPI 至少应为 300。我的图像像素大小为 2560x1536，DPI 为 72。

如何将 DPI 提高到 300？
也有人说调整图像大小是有益的。如何调整图像大小以获得良好的 OCR 效果
Tesseract 最适用于 DPI 至少为 300 dpi 的图像，因此调整图像大小可能会有所帮助。 'so' 在这里意味着什么。调整图像大小和 DPI 之间的关系是什么？

【问题讨论】：

【解决方案1】：

对于 OCR，真正重要的是分辨率以像素为单位。因为物理字符的范围可以从小到大，与采集设备的 DPI 无关。

根据经验，3 像素左右的笔画宽度是一个好的开始。如果较低，调整大小可能没有帮助，因为缺少信息。如果更高，则运行时间可能会过长（或者 OCR 功能无法处理）。

如果不匹配，还要检查包不会尝试在内部调整大小，基于它自己的笔画宽度假设和存储在标题中的 DPI 信息。

【讨论】：