【发布时间】:2020-08-16 08:25:53
【问题描述】:
我有一个由面部图像组成的数据集,以及构成嘴巴的相应地标。 这些地标是一组 2D 点(x,y 像素位置)。 每个图像-地标集数据对都被标记为微笑或中性。
我想做的是训练一个深度学习模型来返回一个新的图像-地标数据对的微笑强度。
我应该寻找什么来帮助我完成下一步? 这是我需要的 CNN 吗?在我有限的理解中,通常的训练输入只是一张图像,我将在其中传递地标集进行训练。或者 SVM 方法会更准确吗?
我正在寻找尽可能高的准确性。
我需要调用的方法是什么?
我很高兴使用 PyTorch、Dlib 或任何框架,我只是有点卡在搜索词上以帮助我前进。
谢谢。
【问题讨论】:
标签: tensorflow machine-learning deep-learning pytorch dlib