【问题标题】:CNN vs SVM for smile intensity detection training?CNN vs SVM 用于微笑强度检测训练?
【发布时间】:2020-08-16 08:25:53
【问题描述】:

我有一个由面部图像组成的数据集,以及构成嘴巴的相应地标。 这些地标是一组 2D 点(x,y 像素位置)。 每个图像-地标集数据对都被标记为微笑或中性。

我想做的是训练一个深度学习模型来返回一个新的图像-地标数据对的微笑强度。

我应该寻找什么来帮助我完成下一步? 这是我需要的 CNN 吗?在我有限的理解中,通常的训练输入只是一张图像,我将在其中传递地标集进行训练。或者 SVM 方法会更准确吗?

我正在寻找尽可能高的准确性。

我需要调用的方法是什么?

我很高兴使用 PyTorch、Dlib 或任何框架,我只是有点卡在搜索词上以帮助我前进。

谢谢。

【问题讨论】:

    标签: tensorflow machine-learning deep-learning pytorch dlib


    【解决方案1】:

    如果不查看数据集并进行实验,很难判断。但希望以下研究材料能够引导您朝着正确的方向前进。

    现在,我假设您没有任何实际微笑强度的标签。

    在这种情况下,可以直接使用现有的微笑检测方法,您将使用最后的激活输出(sigmoid)作为微笑的置信度分数。如果置信度越高,强度应该越高。

    现在,您可以将面部标志点用作单独的特征(通过 LSTM 块传递它们)并在早期/或稍后阶段连接到 CNN,以提高模型的性能。

    如果你有微笑强度的标签,你可以将它作为一个回归问题来解决,CNN 将有一个输出,将尝试回归微笑强度(在这种情况下是使用 sigmoid 的标准化微笑强度)。

    【讨论】:

    • 谢谢!你是对的,我没有强度标签。所以我可以将图像和地标传递给 CNN?还是只是地标?
    • 首先,只尝试图像,按照我提到的项目,你会找到一些代码,例如:github.com/meng1994412/Smile_Detection 并使用 sigmoid 输出作为强度,一旦你想改进你可以设计具有地标的复杂模型,设计此类模型需要了解不同的层。
    • 这里还有一些项目:github.com/topics/smile-detection
    猜你喜欢
    • 2017-06-27
    • 2016-08-29
    • 1970-01-01
    • 2016-05-13
    • 1970-01-01
    • 1970-01-01
    • 2017-02-27
    • 2015-05-04
    • 2015-07-25
    相关资源
    最近更新 更多