【发布时间】:2017-05-19 04:29:45
【问题描述】:
我有一个动物物种多样性数据集,每个月在 3 个样带中观察到(略多于)2 年。我的问题是找出样带之间是否有明显不同的动物多样性。对于这样一个简单的问题,单方面的方差分析几乎是答案,但是,我认为为了控制相当大的季节性波动,可能需要重复测量方差分析来结合每月动物多样性的变化。
下面是我的数据集,以及随时间变化的动物多样性图。
transect<-c(rep("transA",26),rep("transB",25),rep("transC",25))
months<-as.numeric(c(1:26,1:11,13:26,0,2,4:26))
animal_species<-c(2,2,2,4,5,1,5,6,14,8,7,5,5,3,1,2,5,9,8,9,10,10,9,9,7,3,1,3,2,2,3,3,3,7,5,6,5,4,2,2,4,4,5,7,4,5,2,4,2,4,1,1,1,1,3,2,2,3,2,2,1,3,5,3,2,4,2,4,3,6,3,2,2,1,2,1)
animal_df<-data.frame(transect,months,animal_species)
library(ggplot2)
ggplot(animal_df,aes(months,animal_species))+geom_bar(stat='identity')+theme_bw()+facet_grid(transect~.)
但是有两个问题另外违反了方差分析的假设!
首先是我的数据在样带之间的物种数量上有很大差异,并且根据 Levene 的(中值)检验,差异不一样。
animal_AOV<-aov(animal_species~transect, data=animal_df)
leveneTest(animal_AOV)
# Levene's Test for Homogeneity of Variance (center = median)
# Df F value Pr(>F)
# group 2 10.783 7.889e-05 ***
# 73
第二个是数据似乎遵循不同的分布,这可能最容易从每个样带的多样性直方图中看出,其中 TransA 的偏斜似乎比其他两个小。
par(mfrow=c(3,1))
hist(TransA$animal_species,breaks=14,xlim=c(0,14))
hist(TransB$animal_species,breaks=10,xlim=c(0,14))
hist(TransC$animal_species,breaks=10,xlim=c(0,14))
我对社区的问题是:
我认为重复测量方法是最明智的分析途径是否正确?
是否足够担心偏离方差分析的假设?看到有 20 多个观测值,而且观测值的数量比较均衡?
应如何对此类分析进行编码以产生可行的答案(可能考虑到违规行为),关于重复测量 anova 的大量在线信息似乎与如何对此类分析达成一致意见有点矛盾放在一起?
我基本上有一个简单的问题,我的直觉是它应该会因为三个横断面彼此显着不同而失败(至少trackA 比其他两个具有更高的多样性)。有人对如何解决这个问题有任何建议吗?
【问题讨论】:
标签: r anova mixed-models