物体检测业务场景综述
物体检测旨在构造智能算法和程序,来“观察”这个世界。
- 计算机本身是比较困难将这些信息抽象称为一种比较高层语意的表达,去对应现实生活中的名词概念。
- 我们通常所说的“观察”(see),实际上是已经包含了对视觉信息的加工,以及和真实世界的关系映射。
如何理解“观察”这个概念:
- 识别、检测、分割
- 这个物体在这个真实世界当中的3D信息(SLAM)
- 这个场景正在发生什么,希望计算机能够根据图像或者视频,我们回答一些问题(时间、问答)
- 物体检测用于定位图像中的多个不同类别的物体
- 定位+分类
物体检测业务场景综述
物体检测旨在构造智能算法和程序,来“观察”这个世界。
- 计算机本身是比较困难将这些信息抽象称为一种比较高层语意的表达,去对应现实生活中的名词概念。
- 我们通常所说的“观察”(see),实际上是已经包含了对视觉信息的加工,以及和真实世界的关系映射。
如何理解“观察”这个概念:
- 识别、检测、分割
- 这个物体在这个真实世界当中的3D信息(SLAM)
- 这个场景正在发生什么,希望计算机能够根据图像或者视频,我们回答一些问题(时间、问答)
- 物体检测用于定位图像中的多个不同类别的物体
- 定位+分类
算法性能的评价:
- TP:标注框重叠率很高
- FP:重叠率低(甚至没有重叠)和重复检测的框
- precision和recall
- AP和mAP
上边是传统物体检测算法流程,下边是深度学习物体检测算法。
数据集资源:
- Pascal VOC:20个类别
- COCO:91个类别,小目标多、单幅图片目标多、物体大多非中心分布、更符合日常环境,coco检测难度大。
- ILSVRC2012:ImageNet数据集有1400多万幅图片,涵盖2万多个类别,其中有超过百万的图片有明确的类别标注和图像中物体位置的标注
技术难点: - 物体种类多
- 物体变化丰富
- 场景变化丰富
- 尺度、光照、遮挡
- 等等
应用领域: - 细粒度图像检索
- 精准广告
- 内容推荐
- 场景分析
- 图像美颜
- 相册管理
- 等等