人脸关键点检测12——An Occluded Stacked Hourglass Approach

《An Occluded Stacked Hourglass Approach to Facial Landmark Localization and Occlusion Estimation》

IEEE2017，Kevan Yuen and Mohan M. Trivedi

本文主要应用于交通驾驶安全，构建了比较完善的整个系统流程，从人脸识别->关键点检测->头部姿态估计。可以通过眼部和口部关键点判断驾驶员是否有困意，疲劳驾驶等；通过头部姿态来判断驾驶员是否注意力集中等，来辅助驾驶员的操作，避免交通事故的发生。
本文提出Occluded Stacked Hourglass，是在Stacked Hourglass network for body pose joint estimation的基础上进行改进，输入上一级识别到的人脸和输出68个遮挡的热图，每张热图对应于一个人脸关键点。

网络结构：
人脸关键点检测12——An Occluded Stacked Hourglass Approach
Landmark Module：
输入固定尺寸的图像和输出68个热图
Label：振幅为1的高斯分布放置在相对于输入图像的坐标位置，其余热图区域近似为0，热图上的值大致在0~1之间。
如果关键点被遮挡，则幅值使用-1代替+1。

训练：
输入：人脸检测后resize到256*256（flip）
输出：68个64*64的得分图像，是输入图像的1/4。

Ground Truth：
人脸关键点检测12——An Occluded Stacked Hourglass Approach
如果关键点没有被遮挡：A=+1，遮挡为A=-1。
其中， $σ = 1.5$

损失函数：
人脸关键点检测12——An Occluded Stacked Hourglass Approach
平方误差损失，输出64*64的热图对应一个关键点坐标。

计算68个人脸关键点的损失。

《An Occluded Stacked Hourglass Approach to Facial Landmark Localization and Occlusion Estimation》

注：博众家之所长，集群英之荟萃。