【发布时间】:2018-09-13 11:19:02
【问题描述】:
我正在开发一个手势识别程序。我的数据集由不同姿势的手组成。在我跳入神经网络之前,我试图使用 SVM 来获得基线。我的数据集有 6 个要分类的类,每个类大约有 1000 个示例。
我使用了 80-20 拆分。 80% 用于训练,20% 用于测试。在测试集上运行 SVM 模型后,我正在绘制一个混淆矩阵,它向我展示了它的精度约为 96%,召回率约为 96%,F1 分数约为 96%。
以下是我的训练集图像的一些示例:
https://imgur.com/gwRSx3C
https://imgur.com/UxUPj5t
https://imgur.com/wXcaUq6
网络摄像头图像
https://imgur.com/j97cTnp
https://imgur.com/6QDHMAD
https://imgur.com/C9DELsr
以下是我的网络摄像头拍摄的一些图像。
我很自然地感到兴奋。唯一的缺点是,当我将模型连接到网络摄像头进行实时推理时,模型是边缘对接。如果准确率、召回率、f1 如此之高,任何人都知道为什么它可能会做得如此糟糕?
【问题讨论】:
标签: python scikit-learn computer-vision classification svm