本文主要对论文《Crowd counting via scale-adaptive convolutional neural network》的核心思想进行简单介绍。
  先来看一下效果:在Shanghai Tech数据集上(分为Part A和Part B两部分),关于这个数据集的介绍见下表:Part A 共有418张图片,图片的分辨率是不同的,每张图片上包含的人数最少有33个,最多包含3139; Part B 共有716张分辨率相同的图片。
  

SaCNN(论文解读)-人群计数
  
  关于这个数据集的评测用的是MAE(平均绝对误差)和MSE(均方误差) ,在下面会进行介绍。
  
SaCNN(论文解读)-人群计数
  
SaCNN(论文解读)-人群计数
SaCNN(论文解读)-人群计数
  网络的损失函数:通过计算估计的densitymap和对应ground truth之间的欧式距离如下:
SaCNN(论文解读)-人群计数
  式子中θ代表网络参数,是训练图片数,Xi是输入图片,Di是相应的densitymap的ground truth,FD(Xi;θ)表示由输入图像Xi所得的估计的densitymap。
  除了回归density map,论文中还考虑了如下的损失函数来计算head count loss:FY(Xi;θ)Yi是估计的head count 和对应的ground truth,
SaCNN(论文解读)-人群计数
下面介绍评价指标:MAE(平均绝对误差)和MSE(均方误差):FY(Xi;θ)Yi是估计的head count 和对应的ground truth,
SaCNN(论文解读)-人群计数

相关文章: