【问题标题】:How to create an index for a collection of vectors/histograms for content based image retrieval如何为基于内容的图像检索的向量/直方图集合创建索引
【发布时间】:2011-12-22 04:39:40
【问题描述】:

我目前正在编写一个基于视觉词的图像检索系统,类似于文本检索中的向量空间模型。在这个框架下,每个图像都由一个向量表示(或者在文献中有时也称为直方图)。基本上,向量中的每个数字都会计算每个“视觉词”在该图像中出现的次数。如果 2 个图像的向量“接近”在一起,这意味着它们具有许多共同的图像特征,因此是相似的。

我基本上是在尝试为一组这样的向量创建倒排文件索引。我想要一些可以从数千(在试用阶段)扩展到数十万或数百万+图像的东西,这样自制的数据结构黑客将无法工作。

我查看了 Lucene,但显然它只索引文本(如果我错了,请纠正我),而在我的情况下,我希望它索引数字(即向量本身)。我见过人们通过以下方式将矢量转换为文本文档的情况:

--> “w1 w2...wn”。基本上,任何非零组件都被文本单词“w[n]”替换,其中 n 是该数字的索引。然后将此“文档”传递给 Lucene 以进行索引。

使用这种方法的问题是向量的文本表示没有编码特定“单词”出现的频率,因此检索到的图像的排名不会很好。

是否有人知道可以处理向量的成熟索引 API,或者可能为我的向量建议不同的编码方案,以便我可以继续使用 Lucene?我还查看了 Lucene for Image Retrieval (LIRE) 项目并尝试了它附带的演示,但运行该演示时生成的异常数量让我不确定是否要使用它。

至于 API 的语言,我对 C++ 或 Java 持开放态度。

提前感谢您的任何回复。

【问题讨论】:

    标签: computer-vision inverted-index content-based-retrieval


    【解决方案1】:

    您可以尝试GRire,这是一个实现视觉词袋模型的 Java 库。这是我的项目,我目前正在实施倒排索引。

    【讨论】:

      猜你喜欢
      • 2015-03-29
      • 2013-05-25
      • 1970-01-01
      • 2014-11-06
      • 2012-01-18
      • 2014-11-07
      • 2011-12-29
      相关资源
      最近更新 更多