【发布时间】:2017-06-02 18:45:39
【问题描述】:
我想为一个数据集建立一个回归模型,已经知道了:
x_1和y是二次关系,x_2和y是线性关系;但不确定x_2 是否与y 有二次关系,也不确定x_1 和x_2 是否有某种交互。
x_1: ['66.29', '40.96', '73.00', '45.01', '57.20', '26.85', '38.12', '35.84', '75.80', '37.41', '54.38', '46.19', '46.13', '30.37', '39.06', '79.38', '52.77', '55.92']
x_2: ['7.00', '5.00', '10.00', '6.00', '4.00', '5.00', '4.00', '6.00', '9.00', '5.00', '2.00', '7.00', '4.00', '3.00', '5.00', '1.00', '8.00', '6.00']
y: ['196.00', '63.00', '252.00', '84.00', '126.00', '14.00', '49.00', '49.00', '266.00', '49.00', '105.00', '98.00', '77.00', '14.00', '56.00', '245.00', '133.00', '133.00']
但我不知道如何评估它,我在scipy 中尝试了curve_fit,但似乎它不适用于多个自变量。那么有没有办法在python中做到这一点?
【问题讨论】:
-
为什么不使用 ML lib 中的函数,例如 scikit-learn.org/stable/index.html ?自己实现一切重要吗?如果是,那么您应该使用此功能检查
Cost Function和Optimizer,以找出您的最佳参数,例如Gradient Descent -
@MathiasDesch 好吧,找出获取系数的方法,但似乎没有办法评估 sklearn 中的置信区间,是吗...
标签: python python-3.x regression data-fitting