【发布时间】:2015-03-20 14:00:45
【问题描述】:
我正在尝试比较学生测试答案的相似性。所以对于学生 A、B、C 和 D,我想比较每对可能的学生有多少次得到相同的答案。例如,A 和 B 回答了相同的 5/7 个问题,A 和 C 回答了相同的 4/7 个问题,等等。我最终会得到一个单独的列,其中的行反映了每个唯一的对。
这是一个示例数据框:
Student Q1 Q2 Q3 Q4 Q5
A 1 3 2 4 1
B 1 2 4 1 1
C 2 4 4 2 1
D 3 1 2 3 4
E 3 3 1 2 1
到目前为止,我已经使用 combn 设置了对:
test<-combn(Book1$Student,2)
compare<-lapply(1:ncol(test), function(x) rbind(Book1[Book1$Student==test[1,x], ],
Book1[Book1$Student==test[2,x], ]))
这会生成一个具有唯一比较的列表,但我不知道如何对各行的相同响应求和。有什么建议吗?
【问题讨论】:
标签: r