参考文件
视频分类I3D网络
Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset
1. https://blog.csdn.net/paranoid_cnn/article/details/77933316
训练集kinetics,一个四百个类,每个类有至少四百个clips,每个clips十秒钟,属于从youtube上剪切的视频,然后对比了几种现在存在的用于行为识别的几种框架。各种网络的对比。
网络模型如下图所示。
做了如下几个事情:
第一:卷积核和pooling的核由二维扩展到三维。
第二:大的数据视频数据集上训练。
第三:迁移到UCF101,HMDB51,识别结果好。