【问题标题】:Statsmodels Python Missing ValuesStatsmodels Python缺失值
【发布时间】:2018-02-13 14:36:42
【问题描述】:

我正在做一个项目,我必须填补一些缺失的值。 我使用 Python,我看到有一种算法可以进行缺失数据插补。 这种算法称为 Nipals。所以,我决定寻找一种使用它的方法,我发现 statsmodels.multivariate.pca.PCA 可以帮助我。

我有一个名为 A 的 numpy 数组,其中包含 n 行和 p 列。 A 有一些缺失值,它们是 NaN 值。我想用 PCA 来填写 A。但是,没有任何例子可以帮助我做到这一点。

有人可以帮我用 Nipals 算法填充 A 吗?

谢谢。 注:对不起,我是一个法语初学者,我用英文文档不容易。..

【问题讨论】:

    标签: python pca missing-data statsmodels


    【解决方案1】:

    我找到了一种填补缺失值的方法。 假设您有一个名为 A 的 numpy 数组

    from statsmodels.multivariate.pca import PCA
    pc = PCA(data=A,ncomp=1, missing='fill-em')
    A=pc._adjusted_data
    

    享受吧! 您还可以使用另一种方式来填充缺失值:均值、中值、k 邻域、mcmc(蒙特卡洛马尔可夫链)、最常见值...

    【讨论】:

      猜你喜欢
      • 2015-01-15
      • 2020-11-09
      • 2014-04-09
      • 1970-01-01
      • 2021-09-24
      • 2014-10-18
      • 2016-10-06
      • 1970-01-01
      • 2018-05-21
      相关资源
      最近更新 更多