【发布时间】:2011-12-29 20:11:45
【问题描述】:
我有一个大约 300 万行的数据集,结构如下:
PatientID| Year | PrimaryConditionGroup
---------------------------------------
1 | Y1 | TRAUMA
1 | Y1 | PREGNANCY
2 | Y2 | SEIZURE
3 | Y1 | TRAUMA
作为 R 的新手,我很难找到正确的方法将数据重塑为下面概述的结构:
PatientID| Year | TRAUMA | PREGNANCY | SEIZURE
----------------------------------------------
1 | Y1 | 1 | 1 | 0
2 | Y2 | 0 | 0 | 1
3 | Y1 | 1 | 0 | 1
我的问题是:创建 data.frame 的最快/最优雅的方法是什么,其中 PrimaryConditionGroup 的值成为列,按 PatientID 和 Year 分组(计算出现次数)?
【问题讨论】:
标签: r performance reshape