【发布时间】:2017-05-19 20:38:45
【问题描述】:
我的数据框看起来像这样:
> head(temp)
VisitIDCode start stop Value_EVS hr heart rate NU EE0A Value_EVS temp celsius CAL 113C Value_EVS current weight kg CAL
23642 2008253059 695 696 <NA> 36.4 <NA>
24339 2008253059 695 696 132 <NA> <NA>
72450 2008953178 527 528 <NA> 38.6 <NA>
72957 2008953178 527 528 123 <NA> <NA>
73976 2008965669 527 528 <NA> 36.2 <NA>
74504 2008965669 527 528 116 <NA> <NA>
第一行和第二行都是针对同一患者(相同的 VisitIDCode),在第一行中我有心率值,在第二行中我有从时间 2 到 3 的温度值。我想结合这些行,因此结果是一行,如下所示:
VisitIDCode start stop Value_EVS hr heart rate NU EE0A Value_EVS temp celsius CAL 113C Value_EVS current weight kg CAL
23642 2008253059 695 696 132 36.4 <NA>
换句话说,我希望我的数据框通过 VisitIDCode、start 和 stop 的组合是唯一的。这是一个大型数据框,需要组合更多列。 最好的方法是什么,如果可能的话,避免 for 循环? 编辑:我不想删除 NA。如果有 2 行,每行都有一个值和 2 个 NA,我想将它们组合成一行,这样它就有两个值和一个 NA。就像上面的例子。
【问题讨论】:
-
我不想删除 NA。 @Sotos