【发布时间】:2017-10-06 04:32:06
【问题描述】:
我目前有一个宽格式数据框,其中包含干预前和干预后的问卷分数。有 848 名患者至少有一份问卷。我想查看数据以比较分数从干预前到干预后的变化情况。但是,我很苦恼,因为这些数据是宽格式的,而且就每位患者的问卷数量而言,数据并不统一。有一个变量列出了问卷的实例,问卷的值是另一个变量。
这是它当前外观的示例:
a=c('instance1','total1','instance2', 'total2', 'instance3', 'total3',
'instance4','total4', 'instance5','total5')
b=c('postop2', '5', 'postop1', '7', NA, NA, 'preop', '10', NA, NA)
c=c(NA, NA, 'preop', '3', NA, NA, 'postop1', '4', 'postop2', '3')
data.frame(rbind(a,b,c))
问卷数据共有848行。
我需要计算术前和术后问卷的差异。重组这些数据以便获得这些值的最佳方法是什么?我正在苦苦挣扎,因为所有 848 名患者之间的实例并不一致。
感谢您的帮助。
【问题讨论】:
-
如果您查看您的示例,我假设列名将是第一行而不是“X1”、“X2”等。
-
是的,列名是第一行