【问题标题】:Unable to Perform NULL value analysis in pandas dataframe无法在 pandas 数据框中执行 NULL 值分析
【发布时间】:2020-10-18 16:50:21
【问题描述】:

我想在这里执行 NULL 值分析。 这里我提到了数据集的前 2 行

Shop_name         Bikes_avaiable             Shop_location       Average_price_of_bikes   Rating_of_shop

NYC Velo          Ninja,hbx                      Salida                   5685$               4.2               
Bike Gallery      dtr,mtg,Harley Davidson        Portland                 6022$               4.8

除了 shop_name,每一列都有一些 NULL 值。

之前我使用基于均值的插补和基于频率的插补来替换 NULL 值。

但是,我被告知要遵循基于模型的插补技术来替换所有 NULL 值。

任何人都可以建议我如何做到这一点。

【问题讨论】:

    标签: pandas machine-learning data-science


    【解决方案1】:

    我猜基于模型的插补技术是指使用统计模型来预测缺失值。例如,您可以使用K-Nearest Neighbours 模型来预测缺失值。使用不存在缺失值的行上的数据点训练 KNN 模型,并根据存在缺失值的行预测缺失值。您必须对分类值应用 one-hot 编码。

    【讨论】:

      猜你喜欢
      • 2021-12-17
      • 2018-10-14
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2018-06-14
      • 2021-07-23
      • 2020-10-13
      • 2014-06-10
      相关资源
      最近更新 更多