【发布时间】:2017-06-20 02:08:11
【问题描述】:
好的,那么这个算法到底是什么意思?
我所知道的:
i) alpha : 梯度下降的步长有多大。
ii) 现在,∑{ hTheta[x(i)] - y(i) } :指给定 Theta 值的总误差。
误差是指预测值{ hTheta[x(i)] }与实际值之间的差异。[ y(i) ]
∑{ hTheta[x(i)] - y(i) } 为我们提供了来自所有训练示例的所有错误的总和。
最后的 Xj^(i) 代表什么?
在为多变量线性回归实现梯度下降时,我们是否在执行以下操作?
Theta (j) 减:
阿尔法
1/m
次:
{ 第一个训练示例的误差乘以第一个训练示例的第 j 个元素。加
第二个训练示例的错误乘以第二个训练示例的第 j 个元素。加
.
.
.
第 n 个训练示例的 PLUS 误差乘以第 n 个训练示例的第 j 个元素。 }
【问题讨论】:
-
n 是您要估计的参数数量,m 是数据中的观察(训练实例)数量。求和内部是针对单个训练示例的,您可以对所有训练示例运行此算法,直到收敛。
j是参数的索引号。 x^{i} 是第 i 个训练样本的输入特征。 x_{j}^{i} 是第 i 个训练示例中的特征 j。
标签: linear-regression gradient-descent