一袋视觉词编码过程

【问题标题】：bag of visual words encoding process一袋视觉词编码过程
【发布时间】：2016-01-11 04:30:02
【问题描述】：

在图像分类中，我必须在视觉词表示袋中对图像进行编码并训练 SVM 分类器。对图像进行视觉词编码包的制作过程是怎样的？

【问题讨论】：

标签： image-processing computer-vision

【解决方案1】：

程序如下：

首先你要构造一个字典

首先，您必须在训练图像上应用采样（密集/关键点）。简单地将图像分解为等采样的补丁。
对所有训练图像重复上一步。然后，对于每条路径，计算导致 128 维向量的 SIFT 描述符。
对所有图像的所有补丁执行上述步骤会产生一组 128 维特征向量。将这些描述符聚类成 K 个簇并保存它们的中心。这些中心构成模型的视觉词典。

构建视觉词典后

在目标图像上应用采样（密集/关键点）。
为查询图像的每个补丁计算 SIFT 特征描述符。
检查任何补丁位于哪个集群中。选择这些集群的中心（视觉词）作为该补丁的代表。
计算目标图像中每个特定视觉词的数量的直方图。此直方图是图像的描述符/表示。

为您的所有训练集这样做，您可以训练任何现成的分类器来对图像进行分类。

这是管道的可视化：

【讨论】：

猜你喜欢

2013-11-02
2014-06-28
1970-01-01
2017-02-11
2013-08-14
1970-01-01
1970-01-01
2021-04-14
1970-01-01

相关资源

下载 2021-06-05
下载 2022-12-20
下载 2022-12-18

最近更新更多

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode