[论文笔记]多模态数据集预处理方法

摘要

对文本是单个词语的一般采用词袋特征
图片可以采用多种灵活的处理方式
对文本是句子甚至是段落的则需要采用较为复杂的处理方式，参考文献[1-2]中对Wiki和Pascal Sentence数据集的处理方式

Wiki

[论文笔记]多模态数据集预处理方法
参考文献
[1] Wang D, Gao X, Wang X, et al. Multimodal discriminative binary embedding for large-scale cross-modal retrieval[J]. IEEE Transactions on Image Processing, 2016, 25(10): 4540-4554.

[论文笔记]多模态数据集预处理方法
参考文献
[2] Wei Y, Zhao Y, Lu C, et al. Cross-modal retrieval with CNN visual features: A new baseline[J]. IEEE transactions on cybernetics, 2016, 47(2): 449-460.

MIRFlickr

[论文笔记]多模态数据集预处理方法
参考文献
[1] Wang D, Gao X, Wang X, et al. Multimodal discriminative binary embedding for large-scale cross-modal retrieval[J]. IEEE Transactions on Image Processing, 2016, 25(10): 4540-4554.
注：DCMH中对文本数据的描述有误，以此处描述为准

Pascal Sentence

[论文笔记]多模态数据集预处理方法
参考文献
[2] Wei Y, Zhao Y, Lu C, et al. Cross-modal retrieval with CNN visual features: A new baseline[J]. IEEE transactions on cybernetics, 2016, 47(2): 449-460.

相关文章：

猜你喜欢

相关资源

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode