【发布时间】:2016-06-27 15:38:39
【问题描述】:
我读过一些关于 Fisher Vector 的文章,但我仍在学习过程中。它比经典的 BoF 表示更好,利用 GMM(或 k-means,即使通常称为 VLAD)。
但是,我发现它们通常用于分类问题,例如 SVM。
但是图像检索呢?我已经看到它们也被用于图像检索(here),但我不明白一点:给定两个 FV 代表 2 个图像,我们如何计算它们的距离以及“这两个图像有多相似?”
在这种情况下使用它们是否合理?
【问题讨论】:
-
请注意,访问文档需要注册——这是一个温和的要求,但仍然令人惊讶。
标签: image-processing machine-learning computer-vision content-based-retrieval