【发布时间】:2021-05-03 07:35:09
【问题描述】:
我正在搜索如何在我的数据集中替换被排序为“未知”的缺失值 所有未知值都在因子列中.. 例如我的婚姻状况,属性为已婚,单身离婚和未知。我正在寻找一种方法如何替换“未知”而不是删除。其他因素只有是,否,未知。
bank$marital <- factor(c('married','divorced','married','unknown','single'))
我只想用例如“single”替换“unknown”
bank$marital = bank$marital.fillna(bank$marital.mode[yes],inplace = True)
bank$marital[is.na(bank$marital)]<-mean(bank$marital,na.rm=TRUE)
我不能使用均值,因为它的因素... 但是我找不到正确的方法来替换因子中的“未知”值
【问题讨论】:
-
显然没有 c('married','divorced','married','unknown','single') 的意思。您必须选择要替换 NA 的值。我的猜测是“未知”将是正确的选择。那么
bank$marital[is.na(bank$marital)] <- "unknown")? -
我没有 NA 值。NA 值保存为“未知”,我需要将“未知”值替换为例如“x”
标签: r dataframe dataset missing-data