【发布时间】:2018-05-14 12:03:42
【问题描述】:
我正在尝试根据 R 中的分组变量生成一个新列。
我有一个测试结果数据框,其中每个学生的年终考试结果排成一行。
学生分为 A 组和 B 组。A 组在第一学期教化学,然后在第二学期教英语,B 组则反过来教。考试成绩都是年底的。
ID Group English Chemistry
1 A 9 4
2 B 7 3
3 B 7 6
4 A 3 10
etc
我想看看教学顺序是否会导致考试成绩的差异,所以我需要一个名为 Sem1 的列,其中包括 A 组的化学测试和 B 组的英语,另一个名为 Sem2 的列包括 A 组的英语和 B 组的英语化学。
所以它看起来像这样:
ID Group English Chemistry Sem1 Sem2
1 A 9 4 4 9
2 B 7 3 3 7
3 B 7 6 6 6
4 A 3 10 10 3
etc
然后我可以根据学期进行统计。我怀疑这并不难,但我很简单。感谢所有帮助!
【问题讨论】:
-
对于
ID=3为什么是Sem1=6和Sem2=6?English=7怎么了? -
我可能没有正确理解您,但是您需要的信息不是已经存储在
Group列中了吗?可以运行时添加这些新列的目的是什么,例如t.test(English~Group)和t.test(Chemistry~Group)? -
感谢大家,感谢大家发现我的错误 Maurits。你说得很对。 Tifu 可能没有必要像你说的那样做,但我们只想一次比较所有第 1 学期的科目和第 2 学期的所有科目,这样我们就可以检验“学期顺序不会影响化学/英语的整体表现”的假设.