基于vehical检测的3D FCN 深度网络

点击上方“3D视觉工坊”，选择“星标”

干货第一时间送达

作者：简单一点 | 来源：知乎

https://zhuanlan.zhihu.com/p/144336687

本文仅做学术分享，如有侵权，请联系删除。

基于vehical检测的3D FCN 深度网络

3d fully convolutional network for vehicle detection in point cloud

本文是将2D的全卷积网络FCN引入到3D点云中，从而实现3D目标检测。

方法介绍

A. FCN Based Detection Revisited

基于检测框架的FCN的流程可以被分为两个任务：目标预测和Bboxd的回归。如下图所示，FCN 由两个分别对应于两个任务的输出组成。目标预测用于预测是否为目标，bbox预测则回归bbox的尺寸信息。

基于vehical检测的3D FCN 深度网络

设基于vehical检测的3D FCN 深度网络为区域p的objectness map，可以用softmax 或者hinge loss编码。设为bounding box map的输出，可以用由边界框的坐标偏移编码。

设区域p的目标真实值标签为基于vehical检测的3D FCN 深度网络 .区域p对应的目标损失函数为：

基于vehical检测的3D FCN 深度网络

设区域p的真实边界框的偏移量为基于vehical检测的3D FCN 深度网络。则每个边界框的损失函数被定义为：

基于vehical检测的3D FCN 深度网络

因此整个网络总的损失函数被定义为：（其中w用于均衡目标损失函数和边界框损害函数）

基于vehical检测的3D FCN 深度网络

基于vehical检测的3D FCN 深度网络代表objectness map所有的区域，表示所有的目标区域。在部署阶段，选择具有正目标预测的区域。然后收集与这些区域对应的边界框预测，并将其作为检测结果进行聚类。

B. 3D FCN Detection Network for Point Cloud

本文使用方形网格离散化点云。离散数据可以由具有长度、宽度、高度和通道尺寸的 4D 数组表示。对于最简单的情况，仅使用一个值 [0，1] 的通道来显示在相应的网格元素上是否观察到任何点。2D CNN机制可以很自然地拓展到3D网格中去。图2展示了本文使用方法的样例。

基于vehical检测的3D FCN 深度网络

图2。本文使用的3D FCN的一个简单样例。特征图首先通过卷积进行三次下采样。然后在进行上采样。每层之间进行ReLU。deconv4b对应着bounding box map，deconv4a则对应着objectness map。

与 DenseBox 类似，目标区域基于vehical检测的3D FCN 深度网络代表目标的中心区域。对于建议的 3D 案例，使用位于对象中心的 3D 球体。球体内的点标记为正/前景标签。点 p 处的边界框预测由坐标偏移编码，定义为：（代表边界框的八个角点）

3D CNN的训练和预测流程遵循着《 Vehicle detection from 3d lidar using fully convolutional network》。在测试阶段，候选边界框从预测为目标的区域中提取，并通过从所有候选边界框中计算其相邻值进行评分。边界框是从最高分中选择的，并且与所选框重叠的候选框将被抑制。

图 3 显示了检测中间结果的示例。来自目标点的边界框预测绘制为绿色框。请注意，对于严重遮挡的车辆，边界框形状会失真且为聚集。这主要是因为在训练阶段缺乏类似的样本。

图3. 3D FCN 检测过程的中间结果。（a）边界框预测从具有高目标置信度的区域收集，并绘制为绿色框。（b）使用蓝色原始点云绘制的聚类后的边界框。（c） 3D检测，因为（a）和（b）为鸟视图中的可视化。

C. Comparison with 2D CNN

与2D CNN相比，3D CNN的尺寸增量必然消耗更多的计算资源，这主要是由于 1）3D数据嵌入网格的内存成本增加，2）3D内核的仿真计算成本增加。

另一方面，在 3D 空间中自然嵌入目标可避免 2D 情况下的透视失真和比例变化。这使得使用相对简单的网络结构来学习检测成为可能。

实验部分

实验数据集：KITTI

本文使用的评价指标: bounding box overlap on the image plane (计算图像上的重叠面积)

这是 KITTI 基准的原始指标。3D 边界框检测投影回图像平面，投影的最小矩形外壳被视为 2D 边界框。3D 边界框检测以正交投影到 2D 接地平面上。如果与groundtruth的重叠区域 IoU 大于 0.7，则接受检测。此指标自然反映了自动驾驶系统的需求，其中车辆的垂直定位不如水平系统重要。

除了上述指标外，还评估了Average Precision (AP) 和 Average Orientation Similarity (AOS)

本文仅做学术分享，如有侵权，请联系删文。

下载1

在「3D视觉工坊」公众号后台回复：3D视觉，即可下载 3D视觉相关资料干货，涉及相机标定、三维重建、立体视觉、SLAM、深度学习、点云后处理、多视图几何等方向。

下载2

在「3D视觉工坊」公众号后台回复：3D视觉github资源汇总，即可下载包括结构光、标定源码、缺陷检测源码、深度估计与深度补全源码、点云处理相关源码、立体匹配源码、单目、双目3D检测、基于点云的3D检测、6D姿态估计源码汇总等。

下载3

在「3D视觉工坊」公众号后台回复：相机标定，即可下载独家相机标定学习课件与视频网址；后台回复：立体匹配，即可下载独家立体匹配学习课件与视频网址。

重磅！3DCVer-学术论文写作投稿交流群已成立

扫码添加小助手微信，可申请加入3D视觉工坊-学术论文写作与投稿微信交流群，旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群，目前主要有3D视觉、CV&深度学习、SLAM、三维重建、点云后处理、自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流等微信群。

一定要备注：研究方向+学校/公司+昵称，例如：”3D视觉 + 上海交大 + 静静“。请按照格式备注，可快速被通过且邀请进群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球：针对3D视觉领域的知识点汇总、入门进阶学习路线、最新paper分享、疑问解答四个方面进行深耕，更有各类大厂的算法工程人员进行技术指导。与此同时，星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息，打造成集技术与就业为一体的铁杆粉丝聚集区，近2000星球成员为创造更好的AI世界共同进步，知识星球入口：

3d fully convolutional network for vehicle detection in point cloud

方法介绍

A. FCN Based Detection Revisited

B. 3D FCN Detection Network for Point Cloud

C. Comparison with 2D CNN

实验部分

学习3D视觉核心技术，扫描查看介绍，3天内无条件退款 圈里有高质量教程资料、可答疑解惑、助你高效解决问题 觉得有用，麻烦给个赞和在看~

学习3D视觉核心技术，扫描查看介绍，3天内无条件退款

圈里有高质量教程资料、可答疑解惑、助你高效解决问题

觉得有用，麻烦给个赞和在看~