3D物体识别[关闭]答案

【问题标题】：3D object recognition [closed]3D物体识别[关闭]
【发布时间】：2018-03-14 08:17:06
【问题描述】：

我正在开发 AR 解决方案。

用例 - 用户可以从任何角度将相机对准 3D 对象（复印机），它应该给出 3D 对象的姿势。

虽然我在模型目标生成器 - https://www.youtube.com/watch?v=0CIWhxf94wk 的帮助下尝试了 Vuforia，但没有运气。

然后我尝试了 VisionLib - https://visionlib.com/ 它有效，但在某种程度上，我的意思是你必须将它与 HUD 中的图像对齐。

然后我采取了不同的方法并开始探索机器学习选项。我还发现我可以使用 CNN - 传统神经网络。

但这是正确的方法，还是我应该尝试使用 OpenCV 编写自己的解决方案？

或者我应该采取任何其他方法。

我还发现了关于 YOLOv2 - https://pjreddie.com/darknet/yolo/，但我不确定它是否会给我姿势。

目前我能理解的是，我应该使用 CNN 来检测相机帧中的物体，然后在 OpenCV 的帮助下找到它的姿势。上述方法听起来很简单，但需要一些繁重的工作。

我走对了吗？

【问题讨论】：

【解决方案1】：

卷积神经网络可能是解决问题的最佳方法。

使用 CNN，您可以解决检测特定对象（在您的情况下是复印机）的问题。需要的步骤是：

但是

你最终得到的网络不会给你任何关于复印机姿势的信息。它只会说：是的，它在框架中或否，它不在这里。

一种可能的解决方法是为数据集的每个图像编码（别名注释）姿势估计信息（您从设备的 IMU 获取此信息）。然后您需要修改您的网络以考虑此信息。这意味着：

这不是一个简单的任务，真的。希望对您有所帮助。

祝你好运！

【讨论】：