【问题标题】:bag of visual words encoding process一袋视觉词编码过程
【发布时间】:2016-01-11 04:30:02
【问题描述】:

在图像分类中,我必须在视觉词表示袋中对图像进行编码并训练 SVM 分类器。对图像进行视觉词编码包的制作过程是怎样的?

【问题讨论】:

    标签: image-processing computer-vision


    【解决方案1】:

    程序如下:

    首先你要构​​造一个字典

    1. 首先,您必须在训练图像上应用采样(密集/关键点)。简单地将图像分解为等采样的补丁。
    2. 对所有训练图像重复上一步。然后,对于每条路径,计算导致 128 维向量的 SIFT 描述符。
    3. 对所有图像的所有补丁执行上述步骤会产生一组 128 维特征向量。将这些描述符聚类成 K 个簇并保存它们的中心。这些中心构成模型的视觉词典

    构建视觉词典后

    1. 在目标图像上应用采样(密集/关键点)。

    2. 为查询图像的每个补丁计算 SIFT 特征描述符。

    3. 检查任何补丁位于哪个集群中。选择这些集群的中心(视觉词)作为该补丁的代表。

    4. 计算目标图像中每个特定视觉词的数量的直方图。此直方图是图像的描述符/表示。

    为您的所有训练集这样做,您可以训练任何现成的分类器来对图像进行分类。

    这是管道的可视化:

    【讨论】:

      猜你喜欢
      • 2013-11-02
      • 2014-06-28
      • 1970-01-01
      • 2017-02-11
      • 2013-08-14
      • 1970-01-01
      • 1970-01-01
      • 2021-04-14
      • 1970-01-01
      相关资源
      最近更新 更多