【问题标题】:Dendrogram: Grouping By Characteristics树状图:按特征分组
【发布时间】:2017-09-17 08:46:41
【问题描述】:

我过去根据各种在线教程制作了树状图(例如https://rstudio-pubs-static.s3.amazonaws.com/33876_1d7794d9a86647ca90c4f182df93f0e8.html

目标:ExposuresCategory 分组,并在树/树形图中可视化(例如ExpAExpD 将被分组在一起,因为它们都是HeavyMetals

背景:我正在尝试制作以下内容的树/树状图:

Exposures = c("ExpA","ExpB", "ExpC","ExpD","ExpE", "ExpF")
Category = c("HeavyMetal","Hormone", "Pesticide", "HeavyMetal", "Pesticide", "Hormone" )
dataframe = data.frame(Exposures,Category)

我尝试了以下方法:

hp = hclust(dist(dataframe))
plot(hp, labels = Exposures)

但我收到一条错误消息:

Error in hclust(dist(dataframe1)) : 
  NA/NaN/Inf in foreign function call (arg 11)
In addition: Warning message:
In dist(dataframe1) : NAs introduced by coercion

我认为错误消息是因为我没有任何数字数据,但我不确定。

问题:考虑到上述目标,有没有办法从类似于上述数据帧的数据帧制作树/树状图结构?

谢谢!

【问题讨论】:

  • 看来hclust() 需要一个相异矩阵。您能具体说明观察结果之间的差异吗?
  • 我正在谷歌搜索以回答您的问题,但我不太确定如何指定我的观察结果之间的差异。我该怎么做?
  • 您指的是以下链接中的 simil() 吗?
  • 我注意到您的所有Exposures 都是不同的类别。对于测量差异性和聚类数据,这不是一个有用的变量。

标签: r tree dendrogram


【解决方案1】:
install.packages('cluster')
library('cluster')
dissimilarity <- daisy(dataframe)
hc = hclust(dissimilarity)
plot(hc, labels = Exposures)

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-05-15
    • 2016-09-04
    • 1970-01-01
    • 2016-07-29
    • 1970-01-01
    相关资源
    最近更新 更多