【发布时间】:2017-09-17 08:46:41
【问题描述】:
我过去根据各种在线教程制作了树状图(例如https://rstudio-pubs-static.s3.amazonaws.com/33876_1d7794d9a86647ca90c4f182df93f0e8.html)
目标: 将Exposures 与Category 分组,并在树/树形图中可视化(例如ExpA 和ExpD 将被分组在一起,因为它们都是HeavyMetals)
背景:我正在尝试制作以下内容的树/树状图:
Exposures = c("ExpA","ExpB", "ExpC","ExpD","ExpE", "ExpF")
Category = c("HeavyMetal","Hormone", "Pesticide", "HeavyMetal", "Pesticide", "Hormone" )
dataframe = data.frame(Exposures,Category)
我尝试了以下方法:
hp = hclust(dist(dataframe))
plot(hp, labels = Exposures)
但我收到一条错误消息:
Error in hclust(dist(dataframe1)) :
NA/NaN/Inf in foreign function call (arg 11)
In addition: Warning message:
In dist(dataframe1) : NAs introduced by coercion
我认为错误消息是因为我没有任何数字数据,但我不确定。
问题:考虑到上述目标,有没有办法从类似于上述数据帧的数据帧制作树/树状图结构?
谢谢!
【问题讨论】:
-
看来
hclust()需要一个相异矩阵。您能具体说明观察结果之间的差异吗? -
我正在谷歌搜索以回答您的问题,但我不太确定如何指定我的观察结果之间的差异。我该怎么做?
-
您指的是以下链接中的 simil() 吗?
-
我注意到您的所有
Exposures都是不同的类别。对于测量差异性和聚类数据,这不是一个有用的变量。
标签: r tree dendrogram