【发布时间】:2019-08-28 16:58:18
【问题描述】:
我有一个数据集,其中包含有关对患者的多种医疗状况进行诊断的数据。这些维度/列中的值是 NA(患者未在诊断过程中)、1 = 是(诊断出该病症)、2 = 否(未诊断出该病症)。我想创建一个单独的列来计算每个患者 ID 为 1 的列数。我的数据框有 1000 个单独的维度,我需要根据列的索引或列名专门选择。我的数据集是这样的
ID A B C D
1 NA 1 2 1
2 1 1 2 1
3 NA 2 2 1
4 1 1 2 1
5 2 1 1 1
6 2 1 NA 1
我显然有比这更多的列和行,任何解决方案都需要考虑索引。我需要这样做的原因是要了解患者患有的疾病数量。我能够使用“转换”选项在 SPSS 中解决这个问题,因为 SPSS 是我选择的数据分析应用程序。我一直在享受 R 并且对其中可用的统计学习算法的数量很感兴趣。
我已经尝试了apply 函数和colSums,但我在索引以及设置计数函数 = +1 方面遇到了困难。我也研究了 for 循环,但没有解决我的具体问题。
【问题讨论】: