xiashiwendao

数据预处理之归一化和标准化

对于数据的预处理分在思想上称之为归一化以及标准化(normalization)。

首先将归一化/ 标准化,就是将数据缩放(映射)到一个范围内,比如[0,1],[-1,1],还有在图形处理中将颜色处理为[0,255];归一化的好处就是不同纬度的数据在相近的取值范围内,这样在进行梯度下降这样的算法的时候,曲线将会更加简单(由原始的椭圆变成了圆形),如下图所示:

至于缩放的原理就是量纲代表,比如身高和指甲宽度,如果统一都是厘米那么两者不是一个数量级,如果把身高的量纲改为米,那么你会发现身高取值范围和指甲宽度其实是相近的取值范围,这样避免了某个维度成为了影响学习结果的主导。

常见的归一化/ 标准化

1. Standard Scala(z-score standardization):是标准化处理;将元素通过下面的公式进行处理:

x =(x -

分类:

技术点:

相关文章:

  • 2021-10-26
  • 2021-01-23
  • 2021-12-12
  • 2022-02-05
  • 2021-07-29
  • 2021-11-21
  • 2021-07-26
  • 2021-10-17
猜你喜欢
  • 2021-11-24
  • 2021-12-06
  • 2022-12-23
  • 2021-12-03
  • 2021-05-08
  • 2021-11-12
  • 2021-05-03
相关资源
相似解决方案