预测学生期末成绩确定变量,成绩与学习效率之间的关系
import numpy
from pandas import read_csv
from matplotlib import pyplot as plt
from sklearn.linear_model import LinearRegression
data = read_csv(
‘C:\Users\Administrator\Desktop\WBB1.csv’,encoding=‘GBK’
)
绘制散点图,确定回归模型类型
根据前面的数据,画出自变量与因变量的散点图,看看是否可以建立回归方程,在简单线性回归分析中,我们只需要确定自变量与因变量的相关度为强相关性,即可确定可以建立简单线性回归方程,我们很容易就求解出成绩与学习效率之间的相关系数是0.97,也就是具有强相关性,从散点图中也可以看出。建立模型
lrModel = LinearRegression()
选择自变量因变量
x = data[[‘学习效率’]]
y = data[[‘成绩’]]
lrModel.fit(x,y)模型检验
lrModel.score(x,y)模型预测
lrModel.predict([[60],[70]])alpha = lrModel.intercept_[0]
beta = lrModel.coef_[0][0]
alpha + beta*numpy.array([60,70])
相关文章: