如何使用 Firebase ML Kit 在图像中查找标记？答案

【问题标题】：How to find marks in the image with Firebase ML Kit?如何使用 Firebase ML Kit 在图像中查找标记？
【发布时间】：2019-06-18 13:27:49
【问题描述】：

我有适用于 Android 的移动应用程序。我需要在我的应用程序中处理图像。这是示例图片：

这是一张带有标记的桌子的照片。我需要找到这些标记和它们的位置。是否可以进行测试？可以使用 ML Kit for Firebase 吗？

如果是 - 我应该使用哪个 api？如有任何建议，我将不胜感激。

【问题讨论】：

也发布在groups.google.com/forum/#!topic/firebase-talk/Wr3kg-sUwOk
我不确定您为什么需要机器学习。如果我需要区分小写字母 v、大写字母 V 或实际复选标记之间的单元格中的标记，我会使用 ML。您的用例更多地与图像处理有关。我会使用原始模板与标记模板之间的差异，然后将检测坐标映射到初始单元格的行/列值。另一种可能的方法是使用 OCR，假设所有条目都是复选标记（十字或圆圈但不填充空白）。根据用例，我会使用前者。
@KF 谢谢。挺有趣的。但你能更详细地描述你的答案吗？我将在 Flutter 上制作一个移动应用程序。也许你会建议图书馆。
从图像中获取像素：stackoverflow.com/questions/56478321/… 这将是我的差分方法的起始代码。这是非常手动但可行的。另一个建议是将 OpenCV 引入 Flutter：stackoverflow.com/questions/53099700/… OpenCV 允许模式检测，所以我已经看到了。您可以先获取每个单元格的角。然后对每个单元进行像素处理。与 OCR 相关，Firebase 具有提供坐标的文本识别功能：firebase.google.com/docs/ml-kit
嗨@KF。请让您的 cmets 回答。我会接受这个作为正确答案。你向我展示了正确的方式:)。

标签： android firebase flutter ocr firebase-mlkit

【解决方案1】：

我不确定您为什么需要机器学习。如果我需要区分小写字母 v、大写字母 V 或实际复选标记之间的单元格中的标记，我会使用 ML。您的用例更多地与图像处理有关。我会使用原始模板与标记模板之间的差异，然后将检测坐标映射到初始单元格的行/列值。另一种可能的方法是使用 OCR，假设所有条目都是复选标记（十字或圆圈但不填充空白）。根据用例，我会使用前者。

从图像中获取像素，检查this。这将是我的“差异化”方法的初始代码。这是非常手动但可行的。另一个建议是带上OpenCV to Flutter。 OpenCV 允许模式检测，所以我已经看到了。您可以先获取每个单元格的角。然后你可以对每个单元进行像素处理。与 OCR 相关，Firebase 具有提供坐标的文本识别功能。你可以查看他们的文档here。

【讨论】：

我试试这个包flutter_opencv 0.0.3。但我不知道如何找到一个矩形:(，虽然我学会了找到它的起点坐标。
您使用的是什么文档。你用什么函数来获取这些坐标？