【发布时间】:2020-12-18 02:16:34
【问题描述】:
我正在尝试在两个文件之间进行分类报告。两者具有相同的数据,但 test.csv 没有 Survived 列。问题在于分类报告应该在 y 测试中写什么,因为在测试文件中缺少“幸存者”
这是我的代码
import pandas as pd
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import classification_report
train = pd.read_csv('..../titanic/train.csv')
test = pd.read_csv('..../titanic/test.csv')
X = train.drop('Survived' , axis=1)
y = train['Survived']
logmodel = LogisticRegression()
logmodel.fit(X,y)
predictions = logmodel.predict(test)
rr = {'PassengerId':test['PassengerId'] , 'Survived' : predictions}
result = pd.DataFrame(rr)
print(classification_report('what sould i write',predictions))
为了准确性 如果我这样写
logmodel.score(X ,y)
0.797979797979798
这个答案是我预测的模型的准确性吗? 这是对还是错
【问题讨论】:
标签: python scikit-learn logistic-regression