【问题标题】:OpenCV 1.1 K-Means Clustering in High Dimensional Spaces高维空间中的 OpenCV 1.1 K-Means 聚类
【发布时间】:2011-03-08 20:56:39
【问题描述】:

我正在尝试写一袋特征系统图像识别系统。该算法的一个步骤是获取大量的小图像块(比如 7x7 或 11x11 像素),并尝试将它们聚集成看起来相似的组。我从图像中获取我的补丁,将它们转换为灰度浮点图像补丁,然后尝试让 cvKMeans2 为我聚类它们。我认为我在格式化输入数据时遇到问题,以便 KMeans2 返回一致的结果。我之前使用 KMeans 进行 2D 和 3D 聚类,但 49D 聚类似乎是另一种野兽。

我不断得到返回的簇向量的垃圾值,所以很明显这是一个垃圾输入/垃圾输出类型的问题。此外,对于如此庞大的数据集,该算法的运行速度比我认为的要快得多。

在下面的代码中,直接 memcpy 只是我最近一次尝试以正确格式获取输入数据,我花了一段时间使用内置的 OpenCV 函数,但是当您的基本类型是 CV_32FC(49) 时,这很困难。

OpenCV 1.1 的 KMeans 算法能否支持这种高维分析?

有人知道从图像复制到 K-Means 输入矩阵的正确方法吗?

谁能指出我可以使用的免费非 GPL KMeans 算法?

这不是最好的代码,因为我现在只是想让事情正常工作:

    std::vector<int> DoKMeans(std::vector<IplImage *>& chunks){
 // the size of one image patch, CELL_SIZE = 7
 int chunk_size = CELL_SIZE*CELL_SIZE*sizeof(float);
 // create the input data, CV_32FC(49) is 7x7 float object (I think)
 CvMat* data = cvCreateMat(chunks.size(),1,CV_32FC(49) );


 // Create a temporary vector to hold our data
 // we'll copy into the matrix for KMeans
 int rdsize = chunks.size()*CELL_SIZE*CELL_SIZE;
 float * rawdata = new float[rdsize];

 // Go through each image chunk and copy the 
 // pixel values into the raw data array.
 vector<IplImage*>::iterator iter;
 int k = 0;
 for( iter = chunks.begin(); iter != chunks.end(); ++iter )
 {

  for( int i =0; i < CELL_SIZE; i++)
  {
   for( int j=0; j < CELL_SIZE; j++)
   {
    CvScalar val;
    val = cvGet2D(*iter,i,j);
    rawdata[k] = (float)val.val[0];
    k++;
   }

  }
 }

 // Copy the data into the CvMat for KMeans
 // I have tried various methods, but this is just the latest.
 memcpy( data->data.ptr,rawdata,rdsize*sizeof(float));

 // Create the output array
 CvMat* results = cvCreateMat(chunks.size(),1,CV_32SC1);

 // Do KMeans
 int r = cvKMeans2(data, 128,results, cvTermCriteria(CV_TERMCRIT_EPS+CV_TERMCRIT_ITER, 1000, 0.1));

 // Copy the grouping information to our output vector
 vector<int> retVal;
 for( int y = 0; y < chunks.size(); y++ )
 {
  CvScalar cvs = cvGet1D(results, y);
  int g =  (int)cvs.val[0];
  retVal.push_back(g);
 }

 return retVal;}

提前致谢!

【问题讨论】:

  • 我看到这篇文章并尝试了它,因为它与我的问题非常相似,而且这个人至少得到了一些结果。 tech.groups.yahoo.com/group/OpenCV/message/59468 这也没有用,所以我会继续尝试其他的东西。我正处于寻找替代算法的地步。

标签: c++ opencv cluster-analysis vision


【解决方案1】:

虽然我不熟悉“特征包”,但您是否考虑过使用角点检测器和 SIFT 等特征点?

【讨论】:

    【解决方案2】:

    您可能想查看http://bonsai.ims.u-tokyo.ac.jp/~mdehoon/software/cluster/ 以获取另一个开源集群包。

    像这样使用 memcpy 似乎很可疑,因为当你这样做时:

     int rdsize = chunks.size()*CELL_SIZE*CELL_SIZE;
    

    如果 CELL_SIZE 和 chunks.size() 非常大,则您正在创建 rdsize 中的大型内容。如果这大于最大的可存储整数,您可能会遇到问题。

    您要更改此函数中的“块”吗? 我猜你不知道,因为这是一个 K-means 问题。

    所以尝试在这里通过引用传递 const。 (一般来说,这就是你想要做的)

    所以而不是:

    std::vector<int> DoKMeans(std::vector<IplImage *>& chunks)
    

    应该是:

    std::vector<int> DoKMeans(const std::vector<IplImage *>& chunks)
    

    同样在这种情况下,使用 static_cast 比使用旧的 c 样式转换更好。 (例如 static_cast(variable) 而不是 (float)variable )。

    您可能还想删除“原始数据”:

     float * rawdata = new float[rdsize];
    

    可以通过以下方式删除:

    delete[] rawdata;
    

    否则你可能会在这里泄漏内存。

    【讨论】:

    • Shuttle87,很好地捕捉到 rdsize 上的整数溢出。现在这不是问题,但以后会是。至于其他小错误(即没有清理,const 正确性)我只是想看看这是否有效,我肯定会在完成后重新编写/清理所有内容。我将研究您指出的其他集群包。
    • 我突然想到,如果数据大小的存储有问题,那么它也可能是您正在使用的库内部的问题。也许将其发布在 OpenCV 的地方有一些价值,因为他们的库可能无法支持您正在使用的数据大小。
    • 我只看到 cvKMeans 最多可以做三个维度,而你需要打包数据的方式真的很不稳定。我假设输入矩阵将是 sXd 的线性表示,其中 s 是样本数,d 是点的维度。无论如何,我尝试了大约十种不同的方法,但没有任何效果,所以我使用了我在网上找到的 GPL KMeans 算法,它看起来效果很好。我想找一个更开放的许可证。我使用 openCV 已经有一段时间了,但我不知道有一个开放的论坛来提问。
    猜你喜欢
    • 1970-01-01
    • 2015-02-15
    • 2016-04-14
    • 2012-07-22
    • 1970-01-01
    • 2015-04-11
    • 2017-01-26
    • 2021-12-10
    • 2011-08-13
    相关资源
    最近更新 更多