【问题标题】:Handling infinite/large values in column for ML classification为 ML 分类处理列中的无限/大值
【发布时间】:2020-05-18 08:17:28
【问题描述】:

使用公式计算一列(公式不涉及任何日志函数,只是与.sum() 的分组),但正如预期的那样,此列将导致infinite/exponential values,如下所示:

-inf
 nan
 inf
-3.000e+32
 7.3297+23 ...etc (similar data)

我的疑问是,对于二元分类问题,我应该如何将此列作为I could also not avoid this column for prediction 处理。在模型分类器中使用此列之前要使用哪些技术。

谢谢!

【问题讨论】:

    标签: python machine-learning classification missing-data


    【解决方案1】:

    如果您的函数计算特征(列)返回 naninf 我会怀疑。为什么会这样?

    一般来说,如果您有像您这样的大值,您可以尝试应用log-transformation 将您的值缩小到更有用的间隔。

    【讨论】:

      猜你喜欢
      • 2020-09-04
      • 1970-01-01
      • 1970-01-01
      • 2018-03-14
      • 2014-07-19
      • 2011-08-19
      • 2020-10-29
      • 2020-09-02
      相关资源
      最近更新 更多