【发布时间】:2020-10-07 18:38:57
【问题描述】:
我有 1000 名患者来我的诊所进行了三次就诊(就诊 1、就诊 2、就诊 3)。在数据框中,每次访问都注册为一个新行,所以我有 3000 行。创建数据时,仅为每一行输入新信息,因此性别信息仅存在于每个患者的 visit1 行中,并且由于我们在 visit3 筛查癌症,因此该行只能为该列输入“是”或“否”, visit2 和 visit1 的列为空。
我要做的是分析在访问3时接受癌症诊断但所有特征都在访问1中的患者的特征。
我已经这样做了:
cancerdiagnosed <- subset(alldata, cancerdiagnosis =='Yes')
但现在我只有患者被诊断患有癌症的行,缺乏性别数据等等。我想获取我获得的那些患者编号,并使用这些编号来代替这些患者的子集首次就诊。
【问题讨论】:
-
请您使用
dput(head(data))并将输出添加到主帖 - 这将帮助人们给出更好的答案。如果数据包含私人数据,您可以对其进行审查。谢谢。 -
这不是一个罕见的问题。但是,如果您要提供数据的样例,这可能会有所帮助(尝试使用
dput(head(alldata))的结果编辑您的问题)。此外,请提供您的“子集”(cancerdiagnosed)应该是什么样子。每个患者应该有一行,包括所有数据吗?现在,请查看 this post,它展示了如何在组中填写缺失值(或者在您的情况下,在单个患者中填写性别信息)。
标签: r