【发布时间】:2017-11-12 01:46:22
【问题描述】:
我需要帮助从原始数据创建一个同期群退出表。
我有一个如下所示的数据集:
DT<-data.table(
id =c (1,2,3,4,5,6,7,8,9,10,
11,12,13,14,15,16,17,18,19,20,
21,22,23,24,25,26,27,28,29,30,31,32,33,34,35),
year =c (2014,2014,2014,2014,2014,2014,2014,2014,2014,2014,
2015,2015,2015,2015,2015,2015,2015,2015,2015,2015,
2016,2016,2016,2016,2016,2016,2016,2016,2016,2016,2016,2016,2016,2016,2016),
cohort =c(1,1,1,1,1,1,1,1,1,1,
2,2,2,1,1,2,1,2,1,2,
1,1,3,3,3,2,2,2,2,3,3,3,3,3,3))
我想按群组计算辍学率,得到一个这样的表格:
cohortdt<-data.table(
cohort =c(1,2,3),
drop_rateY1 =c(.60,0.0,0.0),
droprate_Y2 =c (.50,.33,0.0))
对于队列 1,Y1 年末的辍学率为 60%。 (即最初入学的学生中有 60% 在第 1 年末辍学。Y2 中的值表示在第 1 年末留校的学生中有 50% 在第 2 年末辍学。
如何根据原始数据创建这样的表?
【问题讨论】:
标签: r