高维空间中的 OpenCV 1.1 K-Means 聚类答案

【问题标题】：OpenCV 1.1 K-Means Clustering in High Dimensional Spaces高维空间中的 OpenCV 1.1 K-Means 聚类
【发布时间】：2011-03-08 20:56:39
【问题描述】：

我正在尝试写一袋特征系统图像识别系统。该算法的一个步骤是获取大量的小图像块（比如 7x7 或 11x11 像素），并尝试将它们聚集成看起来相似的组。我从图像中获取我的补丁，将它们转换为灰度浮点图像补丁，然后尝试让 cvKMeans2 为我聚类它们。我认为我在格式化输入数据时遇到问题，以便 KMeans2 返回一致的结果。我之前使用 KMeans 进行 2D 和 3D 聚类，但 49D 聚类似乎是另一种野兽。

我不断得到返回的簇向量的垃圾值，所以很明显这是一个垃圾输入/垃圾输出类型的问题。此外，对于如此庞大的数据集，该算法的运行速度比我认为的要快得多。

在下面的代码中，直接 memcpy 只是我最近一次尝试以正确格式获取输入数据，我花了一段时间使用内置的 OpenCV 函数，但是当您的基本类型是 CV_32FC(49) 时，这很困难。

OpenCV 1.1 的 KMeans 算法能否支持这种高维分析？

有人知道从图像复制到 K-Means 输入矩阵的正确方法吗？

谁能指出我可以使用的免费非 GPL KMeans 算法？

这不是最好的代码，因为我现在只是想让事情正常工作：

    std::vector<int> DoKMeans(std::vector<IplImage *>& chunks){
 // the size of one image patch, CELL_SIZE = 7
 int chunk_size = CELL_SIZE*CELL_SIZE*sizeof(float);
 // create the input data, CV_32FC(49) is 7x7 float object (I think)
 CvMat* data = cvCreateMat(chunks.size(),1,CV_32FC(49) );


 // Create a temporary vector to hold our data
 // we'll copy into the matrix for KMeans
 int rdsize = chunks.size()*CELL_SIZE*CELL_SIZE;
 float * rawdata = new float[rdsize];

 // Go through each image chunk and copy the 
 // pixel values into the raw data array.
 vector<IplImage*>::iterator iter;
 int k = 0;
 for( iter = chunks.begin(); iter != chunks.end(); ++iter )
 {

  for( int i =0; i < CELL_SIZE; i++)
  {
   for( int j=0; j < CELL_SIZE; j++)
   {
    CvScalar val;
    val = cvGet2D(*iter,i,j);
    rawdata[k] = (float)val.val[0];
    k++;
   }

  }
 }

 // Copy the data into the CvMat for KMeans
 // I have tried various methods, but this is just the latest.
 memcpy( data->data.ptr,rawdata,rdsize*sizeof(float));

 // Create the output array
 CvMat* results = cvCreateMat(chunks.size(),1,CV_32SC1);

 // Do KMeans
 int r = cvKMeans2(data, 128,results, cvTermCriteria(CV_TERMCRIT_EPS+CV_TERMCRIT_ITER, 1000, 0.1));

 // Copy the grouping information to our output vector
 vector<int> retVal;
 for( int y = 0; y < chunks.size(); y++ )
 {
  CvScalar cvs = cvGet1D(results, y);
  int g =  (int)cvs.val[0];
  retVal.push_back(g);
 }

 return retVal;}

提前致谢！

【问题讨论】：

我看到这篇文章并尝试了它，因为它与我的问题非常相似，而且这个人至少得到了一些结果。 tech.groups.yahoo.com/group/OpenCV/message/59468 这也没有用，所以我会继续尝试其他的东西。我正处于寻找替代算法的地步。

标签： c++ opencv cluster-analysis vision

【解决方案1】：

虽然我不熟悉“特征包”，但您是否考虑过使用角点检测器和 SIFT 等特征点？

【讨论】：

【解决方案2】：

您可能想查看http://bonsai.ims.u-tokyo.ac.jp/~mdehoon/software/cluster/ 以获取另一个开源集群包。

像这样使用 memcpy 似乎很可疑，因为当你这样做时：

 int rdsize = chunks.size()*CELL_SIZE*CELL_SIZE;

如果 CELL_SIZE 和 chunks.size() 非常大，则您正在创建 rdsize 中的大型内容。如果这大于最大的可存储整数，您可能会遇到问题。

您要更改此函数中的“块”吗？我猜你不知道，因为这是一个 K-means 问题。

所以尝试在这里通过引用传递 const。（一般来说，这就是你想要做的）

所以而不是：

std::vector<int> DoKMeans(std::vector<IplImage *>& chunks)

应该是：

std::vector<int> DoKMeans(const std::vector<IplImage *>& chunks)

同样在这种情况下，使用 static_cast 比使用旧的 c 样式转换更好。（例如 static_cast(variable) 而不是 (float)variable ）。

您可能还想删除“原始数据”：

 float * rawdata = new float[rdsize];

可以通过以下方式删除：

delete[] rawdata;

否则你可能会在这里泄漏内存。

【讨论】：

Shuttle87，很好地捕捉到 rdsize 上的整数溢出。现在这不是问题，但以后会是。至于其他小错误（即没有清理，const 正确性）我只是想看看这是否有效，我肯定会在完成后重新编写/清理所有内容。我将研究您指出的其他集群包。
我突然想到，如果数据大小的存储有问题，那么它也可能是您正在使用的库内部的问题。也许将其发布在 OpenCV 的地方有一些价值，因为他们的库可能无法支持您正在使用的数据大小。
我只看到 cvKMeans 最多可以做三个维度，而你需要打包数据的方式真的很不稳定。我假设输入矩阵将是 sXd 的线性表示，其中 s 是样本数，d 是点的维度。无论如何，我尝试了大约十种不同的方法，但没有任何效果，所以我使用了我在网上找到的 GPL KMeans 算法，它看起来效果很好。我想找一个更开放的许可证。我使用 openCV 已经有一段时间了，但我不知道有一个开放的论坛来提问。