【发布时间】:2020-11-06 08:47:41
【问题描述】:
我是机器学习领域的新手。我想知道一些事情..当我使用'random_state = 10'时,变量保持不变并且没有任何变化也不会影响模型的准确性..直到现在一切都很好..但是当我不使用它时,变量改变了,它改变了模型的准确性,现在变量不同了,但它们仍然在同一个数据框中,我认为准确性仍然是一样的..这就是机器学习中的工作方式吗?还是我错过了什么?这是我的代码。
X =df[["Mileage","Age(yrs)"]]
y=df["Sell Price($)"]
from sklearn.model_selection import train_test_split
X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.2)
from sklearn.linear_model import LinearRegression
clf=LinearRegression()
clf.fit(X_train,y_train)
clf.predict(X_test)
>>>array([ 38014.9266005 , 14240.40458389, 33695.58936258, 29870.44475795])
y_test
>>>3 40000
8 12000
1 34000
4 31500
clf.score(X_test,y_test)
>>>0.97343231831177046
【问题讨论】:
-
Here 是解释
标签: python machine-learning scikit-learn linear-regression