【问题标题】:Changing image DPI for usage with tesseract更改图像 DPI 以与 tesseract 一起使用
【发布时间】:2017-10-21 02:19:15
【问题描述】:

我正在做一个项目来识别名片中的文本并将它们映射到适当的字段。我正在使用 opencv 进行图像处理。我需要将预处理后的图像提供给 Tesseract-OCR 引擎进行文本识别。This link 声明图像的 DPI 至少应为 300。我的图像像素大小为 2560x1536,DPI 为 72。

  • 如何将 DPI 提高到 300?
  • 也有人说调整图像大小是有益的。如何调整图像大小以获得良好的 OCR 效果
  • Tesseract 最适用于 DPI 至少为 300 dpi 的图像,因此调整图像大小可能会有所帮助。 'so' 在这里意味着什么。调整图像大小和 DPI 之间的关系是什么?

【问题讨论】:

标签: opencv image-processing ocr tesseract dpi


【解决方案1】:

对于 OCR,真正重要的是分辨率以像素为单位。因为物理字符的范围可以从小到大,与采集设备的 DPI 无关。

根据经验,3 像素左右的笔画宽度是一个好的开始。如果较低,调整大小可能没有帮助,因为缺少信息。如果更高,则运行时间可能会过长(或者 OCR 功能无法处理)。

如果不匹配,还要检查包不会尝试在内部调整大小,基于它自己的笔画宽度假设和存储在标题中的 DPI 信息。

【讨论】:

  • 那么,调整图像大小和它的 DPI 之间有什么关系?
  • 理论上只是一个比例,但工具可能会忘记调整 DPI。所以没有普遍的答案。
猜你喜欢
  • 1970-01-01
  • 2011-03-09
  • 1970-01-01
  • 1970-01-01
  • 2015-07-09
  • 2011-04-23
  • 1970-01-01
  • 2011-06-13
  • 1970-01-01
相关资源
最近更新 更多