【问题标题】:How to find marks in the image with Firebase ML Kit?如何使用 Firebase ML Kit 在图像中查找标记?
【发布时间】:2019-06-18 13:27:49
【问题描述】:

我有适用于 Android 的移动应用程序。我需要在我的应用程序中处理图像。这是示例图片:

这是一张带有标记的桌子的照片。我需要找到这些标记和它们的位置。是否可以进行测试?可以使用 ML Kit for Firebase 吗?

如果是 - 我应该使用哪个 api? 如有任何建议,我将不胜感激。

【问题讨论】:

  • 我不确定您为什么需要机器学习。如果我需要区分小写字母 v、大写字母 V 或实际复选标记之间的单元格中的标记,我会使用 ML。您的用例更多地与图像处理有关。我会使用原始模板与标记模板之间的差异,然后将检测坐标映射到初始单元格的行/列值。另一种可能的方法是使用 OCR,假设所有条目都是复选标记(十字或圆圈但不填充空白)。根据用例,我会使用前者。
  • @KF 谢谢。挺有趣的。但你能更详细地描述你的答案吗?我将在 Flutter 上制作一个移动应用程序。也许你会建议图书馆。
  • 从图像中获取像素:stackoverflow.com/questions/56478321/… 这将是我的差分方法的起始代码。这是非常手动但可行的。另一个建议是将 OpenCV 引入 Flutter:stackoverflow.com/questions/53099700/… OpenCV 允许模式检测,所以我已经看到了。您可以先获取每个单元格的角。然后对每个单元进行像素处理。与 OCR 相关,Firebase 具有提供坐标的文本识别功能:firebase.google.com/docs/ml-kit
  • 嗨@KF。请让您的 cmets 回答。我会接受这个作为正确答案。你向我展示了正确的方式:)。

标签: android firebase flutter ocr firebase-mlkit


【解决方案1】:

我不确定您为什么需要机器学习。如果我需要区分小写字母 v、大写字母 V 或实际复选标记之间的单元格中的标记,我会使用 ML。您的用例更多地与图像处理有关。我会使用原始模板与标记模板之间的差异,然后将检测坐标映射到初始单元格的行/列值。另一种可能的方法是使用 OCR,假设所有条目都是复选标记(十字或圆圈但不填充空白)。根据用例,我会使用前者。

从图像中获取像素,检查this。这将是我的“差异化”方法的初始代码。这是非常手动但可行的。另一个建议是带上OpenCV to FlutterOpenCV 允许模式检测,所以我已经看到了。您可以先获取每个单元格的角。然后你可以对每个单元进行像素处理。与 OCR 相关,Firebase 具有提供坐标的文本识别功能。你可以查看他们的文档here

【讨论】:

  • 我试试这个包flutter_opencv 0.0.3。但我不知道如何找到一个矩形:(,虽然我学会了找到它的起点坐标。
  • 您使用的是什么文档。你用什么函数来获取这些坐标?
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2022-06-22
  • 2020-11-09
  • 2023-03-02
  • 2021-02-24
  • 2020-09-24
  • 1970-01-01
  • 2021-12-06
相关资源
最近更新 更多