树状图：按特征分组答案

【问题标题】：Dendrogram: Grouping By Characteristics树状图：按特征分组
【发布时间】：2017-09-17 08:46:41
【问题描述】：

我过去根据各种在线教程制作了树状图（例如https://rstudio-pubs-static.s3.amazonaws.com/33876_1d7794d9a86647ca90c4f182df93f0e8.html）

目标： 将Exposures 与Category 分组，并在树/树形图中可视化（例如ExpA 和ExpD 将被分组在一起，因为它们都是HeavyMetals）

背景：我正在尝试制作以下内容的树/树状图：

Exposures = c("ExpA","ExpB", "ExpC","ExpD","ExpE", "ExpF")
Category = c("HeavyMetal","Hormone", "Pesticide", "HeavyMetal", "Pesticide", "Hormone" )
dataframe = data.frame(Exposures,Category)

我尝试了以下方法：

hp = hclust(dist(dataframe))
plot(hp, labels = Exposures)

但我收到一条错误消息：

Error in hclust(dist(dataframe1)) : 
  NA/NaN/Inf in foreign function call (arg 11)
In addition: Warning message:
In dist(dataframe1) : NAs introduced by coercion

我认为错误消息是因为我没有任何数字数据，但我不确定。

问题：考虑到上述目标，有没有办法从类似于上述数据帧的数据帧制作树/树状图结构？

谢谢！

【问题讨论】：

看来hclust() 需要一个相异矩阵。您能具体说明观察结果之间的差异吗？
我正在谷歌搜索以回答您的问题，但我不太确定如何指定我的观察结果之间的差异。我该怎么做？
artax.karlin.mff.cuni.cz/r-help/library/proxy/html/dist.html
您指的是以下链接中的 simil() 吗？
我注意到您的所有Exposures 都是不同的类别。对于测量差异性和聚类数据，这不是一个有用的变量。

标签： r tree dendrogram

【解决方案1】：

install.packages('cluster')
library('cluster')
dissimilarity <- daisy(dataframe)
hc = hclust(dissimilarity)
plot(hc, labels = Exposures)

【讨论】：