【发布时间】:2016-12-03 21:08:06
【问题描述】:
我想从包装标签Sample Nutrient label 中识别营养信息。这是一个包装图像,不同品牌的标签样式/布局可能不同。但我肯定知道一些事情,布局会有点像标题中的某些关键词,比如“营养”,表格的内容会有一些常用词,比如能量/脂肪等。我想提取这些值文本表单并将其保存到我的数据库中。
示例图像是一个更大问题的一部分,寻找可能包含此部分“营养标签”的轮廓/框。
据我了解,它们是 3 个广泛的步骤。
- 扫描输入图像(产品正面/背面/侧面图像)以寻找可能是包含这些营养信息的目标轮廓的最佳轮廓
- 转到此轮廓并执行 OCR(可能保留布局信息,而不是在 1 行中输出所有内容)
- 扫描文本并查找所需信息。
我是图像识别的初学者。这将是一个很大的帮助,
- 如果我能得到关于我的方法的反馈。例如,我应该在 Image 中查找文本还是收集相似的图像并训练模型然后进行分类?类似于执行人脸识别。
- 如果有人已经解决了这个问题,最好能得到一些指点(重新发明轮子并不好玩)。
- 如果它是一个研究问题,那么我可以参考相关的代码/库/指针/类似的 SO 问题。
如果答案不是一般性的,那将是非常可观的(比如执行特征提取,我不知道什么是特征提取,而是一个示例代码指针会很棒。)
感谢您的时间和帮助。
谢谢 查哈特
【问题讨论】:
标签: image-processing ocr feature-extraction feature-detection