多元梯度下降法演练(1)--特征缩放(特征归一化)
1.目的
将特征值归一化的目的是让代价函数收敛的速度变快。
2.怎么做
2.1 Feature Scaling(特征归一化)
2.1.1 公式
公式为:xia=ximaxxib我们希望将xi的范围控制在−1≤xi≤1
2.1.2 举例:
假设x1的取值范围是(0,2000)x2的取值范围为{0,1,2,3,4,5},因为x1,x2取值范围的巨大差距,导致等值线为

可以看见其梯度下降是曲曲折折,路径走的很长。
如果我们将其归一化,即
x1=2000x1,x2=5x2
那么其等值线为

收敛速度很快。
2.1.3 注意
并不需要完全严格的将其幅度控制在±1之间,吴恩达教授给我们给出的是大的范围是−3≤xi≤3
小的范围是−31≤xi≤31
2.2 mean normalization(均值归一化)
2.2.1公式
公式为:xi=ximax−ximinxi−μi其中,μi为xi的均值。
范围是−0.5≤xi≤0.5