【问题标题】:Replacement of NAs for in the variable?替换变量中的 NA?
【发布时间】:2019-03-25 15:17:42
【问题描述】:

晚上好,

我有一个数据集,其中有一个变量是缺少数据的性别。谁能帮助我如何使用 R Packages 替换这些 NA。我已经尝试过“Mice”包,但它并没有取代 NA,它仍然存在于性别列下的数据中。我提供了下面的示例数据和我的代码。提前感谢您的支持。

Dataset sample

使用的 R- 代码: Used R-codes

问候, 库马尔

【问题讨论】:

标签: r imputation r-mice


【解决方案1】:

代码太多了。您可以尝试使用 method="rf" 或 method="cart" 来估算缺失的数据,尽管根据我的经验,购物车方法似乎更准确。 您还可以使用 preprocess 函数以及 medianImpute 或 knnImpute 中的任何一个,因为它为这种插补提供了很好的结果。 以老鼠为例:

test_imp<-mice(df,m=5,method="cart",printFlag=F)
 test_imputed<-complete(test_imp,3)#Selects third imputation

预处理示例

test_1<-preprocess(testdf,"medianImpute")
test_imputed<-predict(test_imputed,test_1)

【讨论】:

  • 嗨,晚上好,谢谢你的解决方案,但是在执行购物车方法之后,我的 NA 仍然在变量 Gender 中。请告知。
  • 尝试“pmm”或“rf”。您可以使用方法(小鼠)查看更多方法。祝你好运!
猜你喜欢
  • 2020-03-24
  • 2019-02-03
  • 2020-06-18
  • 2021-10-15
  • 1970-01-01
  • 2013-08-06
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多