【发布时间】:2016-02-10 00:37:06
【问题描述】:
我们正在为我的本科最后一年项目使用 kinect 1.0 设备制作手语翻译器。 到目前为止,我们已经使用 kinect sdk 中的骨架 api 实现了二维手势识别,并在其上应用了 DTW 算法。 我们还跟踪手指,并使用轮廓和在轮廓上应用凸包来区分帧中显示了多少手指。我们使用 C# 和 Emgucv 来实现这一点。
现在我们陷入了如何将数据转换为 3d 坐标的问题。我不明白的是:
3D 可视化效果如何?我的意思是现在我们只使用深度流并在其上应用皮肤分类器,仅将皮肤部分显示为白色像素,将其余对象显示为黑色像素,并且我们在颜色流中显示轮廓和凸包区域。对于 3d,我们将使用相同的深度和颜色流?如果是,那么我们将如何将数据和坐标转换为 3d?
对于涉及手指触摸鼻子的手势,我将如何隔离轮廓区域以不包括整个脸部,而只是告诉哪个手指触摸鼻子的哪一侧?这是 3d 的用武之地吗?
-
有哪些 api 和库可以在 c# 中帮助我们?
【问题讨论】: