【发布时间】:2015-06-10 07:25:59
【问题描述】:
我对 sklearn linear_model.LinearRegression(module) 的输入有一些疑问。
ages_train = [[20, 10000], [22, 12000], [22, 14000], [25, 17000], [30, 29000]]
net_worths_train = [10000, 12000, 14000, 17000, 29000]
reg = linear_model.LinearRegression()
reg.fit(ages_train, net_worths_train)
上述方法有效,但难以绘制。例如,这样做是行不通的:
plt.scatter(ages_train, net_worths_train, color = "b", label = "train data")
所以我想做的是输入这个:
ages_train = np.array([20, 22, 25, 27, 30, 31, 31, 34, 42, 50])
net_worths_train = np.array([10000, 12000, 16000, 20000, 30000, 33000, 34000, 38000, 49000, 60000])
但是这种数据格式不适用于 linear_model.LinearRegression 的 .fit() 函数。输入数据并使其易于绘制的正确方法是什么?使用 numpy 数组更可取吗?
【问题讨论】:
标签: python scikit-learn linear-regression