多模块信息融合()
信息融合:字面意思的整合。分为信息和融合两部分
信息:对于机器学习中的信息来看,包括1.数据集(图像,标签,GT),2.特征:经过神经网络而得到的特征,属于中间的信息。3.筛选器:最后的融合,包括输出的内容,损失函数的融合。
转自博客:多模态融合
多模态表示学习是指通过利用多模态之间的互补性,剔除模态间的冗余性,从而学习到更好的特征表示。主要包括两大研究方向:联合表示(Joint Representations)、协同表示(Coordinated Representations)、编解码。联合架构是将单模态投影到一个共享的子空间。以便能够融合多个模态的特征。协同融合是包括跨模态相似模型和典型类似分析,有点类似于通过语音做标签来对视频进行分类。编解码是用于将一个模态映射为另一个模态的中间层。下面一张图反映了各个研究领域使用上述三个方法的分布。
联合架构:多模态联合架构最简单的方法就是直接连接,也就是加法
学习笔记2020-10-22(多模块问题)

协同架构:
学习笔记2020-10-22(多模块问题)

编解码器表示:
学习笔记2020-10-22(多模块问题)
每一种信息的来源或者形式,都可以称为一种模态。例如,人有触觉,听觉,视觉,嗅觉;信息的媒介,有语音、视频、文字等;多种多样的传感器,如雷达、红外、加速度计等。以上的每一种都可以称为一种模态。

RGB-D的显著性检测分为两个部分,RGB层和D层的两部分是否可以称之为双模态呢????应该是可以。

相关文章:

  • 2022-01-26
  • 2021-04-09
猜你喜欢
  • 2021-12-04
  • 2021-09-30
  • 2021-12-01
  • 2021-06-22
  • 2021-08-31
  • 2021-12-26
  • 2021-09-15
相关资源
相似解决方案