【发布时间】:2015-04-04 14:04:28
【问题描述】:
我的数据如下所示:
ID Diagnosis_1 Diagnosis_2 Diagnosis_3 Diagnosis_4
A 1 0 0 0
A 1 0 0 0
A 1 0 0 0
B 0 1 0 0
C 0 0 0 1
C 0 1 0 0
D 0 0 0 1
E 0 0 1 0
E 0 1 0 0
E 0 0 1 0
Diagnosis_1:Diagnosis_4 都是二进制的,代表诊断的存在(1)或不存在(0)。我想做的是创建一个如下所示的数据框:
ID Diagnosis
A 1
A 1
A 1
B 2
C 4
C 2
D 4
E 3
E 2
E 3
无论我读了多少次关于 reshape/reshape2/tidyr 的文档,我都无法理解它们的实现。
我可以使用 dplyr 的 mutate 来解决我的问题,但这是实现我的目标的一种耗时且迂回的方式。
编辑:编辑数据以更真实地代表我的实际数据框。
【问题讨论】: