【发布时间】:2020-02-25 00:40:59
【问题描述】:
我正在尝试学习如何实现 MICE 来为我的数据集估算缺失值。我听说过 fancyimpute 的 MICE,但我也读到 sklearn 的 IterativeImputer 类可以完成类似的结果。来自 sklearn 的文档:
我们的 IterativeImputer 实现受到 R MICE 的启发 包(链式方程的多元插补)[1],但是 与它的不同之处在于返回单个插补而不是多个 归责。但是,IterativeImputer 也可以用于多个 通过重复将其应用于同一数据集 sample_postterior=True 时的不同随机种子
我已经看到在不同的管道中使用“种子”,但我对它们的理解不够深入,无法在自己的代码中实现它们。 我想知道是否有人可以解释并提供一个示例,说明如何使用 sklearn 的 IterativeImputer 为 MICE 插补实现种子?谢谢!
【问题讨论】:
-
如果你愿意放弃 sklearn,你可以试试miceforest。
标签: python dataframe missing-data sklearn-pandas