【问题标题】:String clustering using matlab?使用matlab进行字符串聚类?
【发布时间】:2015-08-31 10:31:14
【问题描述】:

我有一个包含相对较小字符串(1-2 个单词)的约 200k 个条目的单元格数组。我正在尝试根据字符串相似性对它们进行聚类。我尝试使用 levenshtein 距离来创建距离矩阵(使用循环将每个字符串与所有其他字符串进行比较)以在其上使用分层或 kmeans 聚类,但是一旦形成距离矩阵(特别是在MATLAB)。如果有人有任何想法或建议,将不胜感激。

【问题讨论】:

    标签: matlab cluster-analysis


    【解决方案1】:

    k-means 不能对距离矩阵进行运算

    它仅使用 means 和与 mean 的平方偏差(=variance)。

    层次聚类在距离矩阵上效果很好。有关如何传递预先计算的距离矩阵,请参阅文档。

    【讨论】:

      猜你喜欢
      • 2013-03-07
      • 2013-12-10
      • 2014-05-29
      • 2021-10-30
      • 2017-09-02
      • 1970-01-01
      • 2019-07-03
      • 2014-07-12
      • 2014-09-02
      相关资源
      最近更新 更多