【发布时间】:2021-10-29 09:08:10
【问题描述】:
我有一个数据集,其中包含来自不同行业组的许多公司的两个变量(x1 和 x2)。我计算了大约 500 家公司的变量“test1”。我们得到以下代码:
df$test1 <- df$x1 - df$x2
library(broom)
result.test <- df %>%
group_by(industry) %>% do(tidy(t.test(.$test1, alt="two.sided", mu=0)))
结果按“行业”分组,但我不清楚 t 检验如何进行。是对每个变量“test1”进行t检验,然后在行业组中呈现平均结果,还是对每个行业组确定“test1”的平均值,然后进行t检验?
【问题讨论】:
-
我对你的问题有点不清楚。数据集中只有一个
test1变量,所以我不知道你所说的“每个变量test1”是什么意思...? -
我的数据集中有 500 家公司。为每个公司计算变量“test1”。我更新了我的问题
标签: r tidy hypothesis-test