【发布时间】:2016-02-16 06:51:37
【问题描述】:
编辑:这里是任何有问题的人的完整代码github.com
我正在尝试使用 SIFT 和 BOW 进行图像识别项目。到目前为止,我正在尝试训练和构建我的字典。我已经从 5 个不同的类中读取了图像,计算了描述符并将它们并排添加到 python 列表 ([]) 中。现在,我正在尝试使用 Python 版本的 BOWMeansTrainer 将我的描述符与 k = 5 进行聚类(这是正确的吗?对于 5 个类?)。我试图通过 cluster() 我的描述符向量,但我得到了错误
Traceback (most recent call last):
File "C:\Python27\Project2\beginning.py", line 40, in <module>
bow.cluster(des)
TypeError: descriptors data type = 17 is not supported
我不确定将我的 numpy 数组放入什么格式,有人知道吗?
sift = cv2.SIFT()
descriptors = []
for path in training_paths:
image = cv2.imread(path)
print path
gray = cv2.cvtColor(image, cv2.CV_LOAD_IMAGE_GRAYSCALE)
kp, dsc= sift.detectAndCompute(gray, None)
descriptors.append(dsc)
des = np.array(descriptors)
k=5
bow = cv2.BOWKMeansTrainer(k)
bow.cluster(des)
如您所见,我一直在附加 sift 描述符,然后尝试转换为 numpy 数组(所需的格式)。
【问题讨论】:
-
BoW 算法的参数 k 与你要分类的类的数量无关,它是聚类的数量(即视觉词)。它基本上表示生成的特征向量的维数,5 太小了。我已经看到它成功地使用了从 500-1000 到 1M 的 k。看看here
-
你说得对,这是一篇较早的帖子,但我记得我认为 5 个集群是合乎逻辑的,因为我有 5 个类,所以我想要 5 个质心。一个更现实的数字会更高
标签: python opencv k-means sift