SLAM学习笔记——BOW

基本思路

简言之，分类-匹配-比较

词袋的构建和查询

朴素的聚类算法：K-means

词袋中的单词规模是很大的，如何快速查词呢？比较简单的是k叉树，它时k-means的扩展。
SLAM学习笔记——BOW

假设由N个特征点，我们可以对其分为k个类，这k个类各自又可以继续分为k个类，深度d可以自己决定，最开始的N个特征点称为“根”，经过d层后得到的众多分类称为“叶”。

在查找某个特征对应的单词时，只需要逐层筛选，经过d次即可到达叶端，找到目标。

权重和相似度

不同的单词在图像的区分上的重要程度不一样，如“文档”“足球”就比“的”“是”等词更能代表一个句子的意义，因此必须对word加权重。

常用的加权重方法是TF-IDF（Term Frequency-Inerse Document Frequency）。
TF：单词在一幅图像中出现的频率。
IDF：单词在词袋中出现的频率。

其思想是：如果某单词在一幅图像中出现的频率很高或在词袋中出现的频率很低，说明它区分度很高。
假设某图像含有n个单词，单词wi出现了ni次，则TFi=nin
假设数据集有m类单词，单词wi在其中有mi个，则IDFi=logmmi
单词wi的权重η=TFi⋅IDFi

这样我们就可用一个含有多个单词及对应权重的向量来描述一幅图

v A ≜ {(w 1, η 1), (w 2, η 2)}, . . ., (w N, η N)}

如何计算vA和vB的差异呢？
可以利用范数（方法不一）比如：

s (v A - v B) = 2 \sum i = 1 N | v A i | + | v B i | - | v A i - v B i |