【发布时间】:2017-10-11 21:30:49
【问题描述】:
我想使用名为timereg 的R 包中的aalen() 函数执行包括时变协变量的生存分析。但是,我仍然对如何在数据框中显示数据以及如何指定模型公式感到困惑。
这是一个组成的数据集:
subject_id 生存时间体重身高结果指标
1 3 65 1.8 0
1 4 68 1.8 0
1 7 70 1.8 1
2 2 55 1.6 0
2 9 53 1.6 0
3 2 62 1.7 0
3 3 65 1.7 0
3 5 64 1.7 0
3 6 66 1.7 0
这里有一些解释:
- 共有 3 名研究对象,由
subject_id变量标识,分别进行了 3、2、4 次随访。 -
weight是一个时变协变量。 -
height与时间无关,因此对于每个主题,每次跟进时都保持不变。 - 假设
survival_time的单位是年,那么感兴趣的事件发生在主题1的第7年。 - 主题 2 和 3 都是右删失案例。
- 属于同一主题的每个跟进都可以通过
survival_time订购。
最后,我的问题列表(即使您没有所有答案,或者我的解决方案是正确的,请不要犹豫发表评论):
- 我对包含随时间变化的协变量的生存数据的表示是否正确?
- 如果第一个问题的答案是“否”,那么您能否指出问题所在并提供一些解释?
- 假设数据集没问题,那么如何指定模型公式并拟合
aalen模型(或任何其他包含时变协变量的模型)?是不是类似:
aalen(formula = Survf(survival_time, outcome_indicator) ~ const(height) + weight, data = data_set, id = data_set$subject_id)
其中Survf() 函数用于组合两个与结果相关的变量; const() 用于表示时变协变量,其他协变量保持原样; data_set 是数据框的名称;而id参数用于关联同一主题的不同行?
【问题讨论】:
标签: r machine-learning statistics dataset survival-analysis