GVCNN——多视角分组选择

GVCNN: Group-View Convolutional Neural Networks for 3D Shape Recognition CVPR2018

和MVCNN一样，基于多视图对三维物体进行识别分类的网络结构。GVCNN的核心思路是：对不同视角的特征进行区分度打分，落在同一得分区间的划分到同一组，同时给每组生成一个权重，用于加权聚合得到最终特征。分值用sigmoid限制在0~1范围内，然后事先将（0，1）区间划分成M个组。

感觉想法可以，但很难学习到分组信息。

网络整体结构：

FCN提取原始的视角特征 raw view descriptors；
CNN提取最终的视角特征 final view descriptors；
用raw视角特征作为Grouping Module的输入，计算分组结果和每组权重；
根据分组结果对final视角特征进行分组，并进行view pooling得到group descriptors；
用每组权重对group descriptors进行加权融合，得到最终的shape descriptor；
全连接分类。

GVCNN——多视角分组选择

Grouping Module

输入为N个原始视角特征Xi；
用共享的FC对输入特征进行处理，输出特征为Oi；
计算每个视角的得分si = sigmoid(log(abs(Oi)));
设分为M个组，计算第j个组的权重：；

GVCNN——多视角分组选择

相关文章：

2021-08-03
2022-12-23
2022-12-23
2022-12-23
2022-12-23
2022-12-23
2021-10-17
2022-12-23

猜你喜欢

2022-01-07
2022-12-23
2022-12-23
2022-12-23
2022-12-23
2021-10-10

相关资源

下载 2023-02-25
下载 2021-06-25
下载 2021-06-24
下载 2023-01-04

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode