【发布时间】:2017-11-11 05:04:42
【问题描述】:
我不确定在从列表中创建因子时是否应该包含级别:
random_merge_patients$MedCond <-factor(sort(random_merge_patients[[35]]))
因子示例如下所示:
[6589] "wt loss ftt arthritis anemia of chronic disease mild cognitive impairment hx gout dehydration prednisone therapy long term med use"
如果应该选择关卡,我会选择什么?任何人都可以澄清一下,因为这让我感到困惑。
我将使用这个变量来创建一个虚拟变量,但即使我没有收到错误消息,$Dementia 中的所有值都是 0,但有些应该是 1:
random_merge_patients$'MedCond_Dementia'<-ifelse(random_merge_patients$'MedCond' == "dementia",1,0)
【问题讨论】:
-
你的例子对于真正的帮助来说有点稀疏,但我建议你的例子
MedCond,因素真的不合适。我建议将它们保留为character,并使用c$MedCond_Dementia <- grepl("\\bdementia\\b", x$MedCond, ignore.case=TRUE)之类的东西,因为...=="dementia"不能作为“字符串包含...”工作。
标签: r factors dummy-variable