【问题标题】:Auto Text Recognition (OCR) from Image图像的自动文本识别 (OCR)
【发布时间】:2016-12-03 21:08:06
【问题描述】:

我想从包装标签Sample Nutrient label 中识别营养信息。这是一个包装图像,不同品牌的标签样式/布局可能不同。但我肯定知道一些事情,布局会有点像标题中的某些关键词,比如“营养”,表格的内容会有一些常用词,比如能量/脂肪等。我想提取这些值文本表单并将其保存到我的数据库中。

示例图像是一个更大问题的一部分,寻找可能包含此部分“营养标签”的轮廓/框。

据我了解,它们是 3 个广泛的步骤。

  1. 扫描输入图像(产品正面/背面/侧面图像)以寻找可能是包含这些营养信息的目标轮廓的最佳轮廓
  2. 转到此轮廓并执行 OCR(可能保留布局信息,而不是在 1 行中输出所有内容)
  3. 扫描文本并查找所需信息。

我是图像识别的初学者。这将是一个很大的帮助,

  1. 如果我能得到关于我的方法的反馈。例如,我应该在 Image 中查找文本还是收集相似的图像并训练模型然后进行分类?类似于执行人脸识别。
  2. 如果有人已经解决了这个问题,最好能得到一些指点(重新发明轮子并不好玩)。
  3. 如果它是一个研究问题,那么我可以参考相关的代码/库/指针/类似的 SO 问题。

如果答案不是一般性的,那将是非常可观的(比如执行特征提取,我不知道什么是特征提取,而是一个示例代码指针会很棒。)

感谢您的时间和帮助。

谢谢 查哈特

【问题讨论】:

    标签: image-processing ocr feature-extraction feature-detection


    【解决方案1】:
    1. 需要收集至少 200-300 张图像才能进行充分的训练。

    2/3。我确实解决了这个问题,但它不是使用免费的解决方案完成的,所以我不应该在这里给出指示。

    【讨论】:

      猜你喜欢
      • 2016-10-11
      • 1970-01-01
      • 2019-02-24
      • 1970-01-01
      • 1970-01-01
      • 2023-03-20
      • 2015-09-17
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多