【问题标题】:Should I use vegdist or dist for hclust?我应该为 hclust 使用 vegdist 还是 dist?
【发布时间】:2021-02-12 02:10:58
【问题描述】:

我正在尝试使用二进制数据进行层次聚类分析,对于距离矩阵,我应用了 vegan 包中的函数 vegdist()

dist.jac <- vegdist(final_df, method="jaccard", binary = TRUE)

接下来,我使用了函数 hclust,但我不确定是否应该使用 vegdist() 生成的相异矩阵:

jac <- hclust(dist.jac, method = "ward.D")

或尝试这样的事情(如我所见):

jac <- hclust(dist(dist.jac), method = "ward.D")

因为函数hclust() 需要“dist 产生的相异结构”。但另一方面,vegan 包说“应该提供一个替代 dist 并返回相同类型的距离对象”和“该函数是 dist 的替代品”。申请dist(dist.jac) 对我来说没有多大意义,但我已经看到这样做了,所以如果有人能向我解释我应该使用哪一个,我将非常感激!

【问题讨论】:

    标签: cluster-computing hierarchical-clustering vegan hclust vegdist


    【解决方案1】:

    如果有人在做dist(dist.jac),他们得到的是数据不同的不同,而不是数据的不同。这很少有道理。

    就像 vegan 文档所说,vegdistdist 的直接替代品。使用哪一个并不重要。如果差异仅在一种替代方案中可用,请使用它。如果两者都可用,请使用其中任何一个。在这种情况下,我个人更喜欢dist,因为它不需要调用任何贡献的包。

    【讨论】:

      猜你喜欢
      • 2019-06-09
      • 1970-01-01
      • 2010-12-01
      • 2012-08-19
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2018-09-05
      • 1970-01-01
      相关资源
      最近更新 更多