【发布时间】:2014-03-25 18:12:46
【问题描述】:
我希望有人能给我建议,告诉我如何使用 R 从 Jaccard 集群中获取置信区间。我有 1970 年代和今天在四个地点的物种数据。当我运行以下代码时,我得到了一个很好的图表,显示我现在的一个站点比另一个站点更接近历史。我相信人们会问重要性。我在系统发育树上看到过类似的置信区间,但我不确定如何获得这些结果。我假设我通过引导测试执行此操作,但我不确定如何从 boot() 获取结果或如何将它们放在我的集群图上。任何建议将不胜感激。
我制作集群的代码:
historicalwo <-read.csv("/users/Victoria/Desktop/Stat Documents/historicalwo.csv",
row.names = 1)
jaccard2 <- vegdist (historical, method = "jaccard")
plot (hclust (jaccard2), hang = -1,main = "Sites clustered by Jaccard similarity",axes = FALSE,
ylab = "")
然后我制作了一个包含 3 列的 jaccard 结果的 .csv,站点 1、站点 2 和两个站点的 jaccard 索引。
jaccardboot
bs <- function(formula, data, indices) {
d <- data[indices,]
fit <- lm(formula, data=d)
return(coef(fit)) }
results <- boot(data=jaccardboot,statistic=bs,
R=100, formula=site1~jaccard+site2)
结果
我得到: 启动错误(数据 = jaccardboot,统计 = bs,R = 100,公式 = site1 ~: 要替换的项目数不是替换长度的倍数 另外:有50个或更多的警告(使用warnings()查看前50个)
【问题讨论】:
标签: hierarchical-clustering statistics-bootstrap