【发布时间】:2013-06-29 03:20:12
【问题描述】:
我正在使用 Scikit 对一些随机数据点执行普通的线性回归。但是,我对他们在 fit 方法中的 documentation 中的 target values 的含义感到困惑。
我将X 设置为形状为 100 x 2(二维)的数据点数组。我应该传递什么作为 y 参数的输入?
【问题讨论】:
标签: python scikit-learn linear-regression
我正在使用 Scikit 对一些随机数据点执行普通的线性回归。但是,我对他们在 fit 方法中的 documentation 中的 target values 的含义感到困惑。
我将X 设置为形状为 100 x 2(二维)的数据点数组。我应该传递什么作为 y 参数的输入?
【问题讨论】:
标签: python scikit-learn linear-regression
【讨论】:
在这种情况下,“目标”是“因变量”、“响应变量”、“回归”、“测量变量”、“响应变量”、“解释变量”、“结果变量”的synonym, “实验变量”和“输出变量”。 IE。这是你试图预测的事情。
【讨论】:
reg.fit(data[:,0], data[:,1]) 传递给 fit 函数,但我收到一条错误消息,指出 tuple index out of range。我是不是误会了?
data[:,0] 形状不对,你需要data[:, :1]。每个样本都必须是一行。 (scikit-learn 真的是为多变量问题而构建的,所以如果你有一个单变量问题,你必须适应一下。)
data[:,:1] 不太好用,只是像 X 参数一样传递 data。我相信我了解它的工作原理,再次感谢!
data,那么你会得到一个多元回归模型,其中输出总是等于第二个输入变量。那没用。