【发布时间】:2018-03-14 08:17:06
【问题描述】:
我正在开发 AR 解决方案。
用例 - 用户可以从任何角度将相机对准 3D 对象(复印机),它应该给出 3D 对象的姿势。
虽然我在模型目标生成器 - https://www.youtube.com/watch?v=0CIWhxf94wk 的帮助下尝试了 Vuforia,但没有运气。
然后我尝试了 VisionLib - https://visionlib.com/ 它有效,但在某种程度上,我的意思是你必须将它与 HUD 中的图像对齐。
然后我采取了不同的方法并开始探索机器学习选项。 我还发现我可以使用 CNN - 传统神经网络。
但这是正确的方法,还是我应该尝试使用 OpenCV 编写自己的解决方案?
或者我应该采取任何其他方法。
我还发现了关于 YOLOv2 - https://pjreddie.com/darknet/yolo/,但我不确定它是否会给我姿势。
目前我能理解的是,我应该使用 CNN 来检测相机帧中的物体,然后在 OpenCV 的帮助下找到它的姿势。 上述方法听起来很简单,但需要一些繁重的工作。
我走对了吗?
【问题讨论】:
-
Conv 网络听起来是正确的方法。这可能是一篇你应该阅读的论文:arxiv.org/abs/1411.5928
标签: opencv machine-learning computer-vision augmented-reality