Neural Aggregation Network for Video Face Recognition是CVPR2017的一篇论文,来源https://arxiv.org/abs/1603.05474。


主要目标是做基于视频的人脸识别。

网络分两个模块:

模块1 Feature embedding module:采用GoogLeNet+Batch Normalization的普通人脸识别网络,针对每张图像或者每帧图像的input,得到128D的特征向量。

模块2 Aggregation module:此乃本文的创新点,同一个人的多张图像或者视频序列通过模块1可以得到多个特征向量,将这些特征向量作为模块2的input,模块2能够学习到自适应的,内容相关的池化策略,从而得到一个融合后的128D的特征向量。


下图为本文架构核心:

NAN论文解读:Neural Aggregation Network for Video Face Recognition








相关文章:

  • 2022-01-15
  • 2021-09-06
  • 2022-01-08
  • 2021-09-24
  • 2021-04-13
  • 2021-12-15
  • 2021-04-27
  • 2021-09-19
猜你喜欢
  • 2021-09-12
  • 2022-01-17
  • 2021-04-12
  • 2021-07-09
  • 2021-04-21
  • 2021-10-06
相关资源
相似解决方案