【发布时间】:2013-06-17 08:44:24
【问题描述】:
我需要估算缺失值。我的数据集有大约 800,000 行和 92 个变量。我在 r 的 imputation 包中尝试了 kNNImpute,但看起来数据集太大了。 R中的任何其他包/方法?我宁愿不使用均值来替换缺失值。 谢谢
【问题讨论】:
-
CRAN 上什至还有一个用于估算的任务视图:cran.r-project.org/web/views/OfficialStatistics.html 但也许你这个问题更适合 stats.exchange.com?也许您还应该解释一下您的“数据集太大”的方式。
-
我对大约 800000 行和 15 个变量的数据集有类似的问题。我想用
VIM::kNN估算缺失值,但我收到错误消息:Error: cannot allocate vector of size 113.1 Gb,当然这比我的机器 RAM 还要多。有什么建议吗?
标签: r imputation