【发布时间】:2020-07-16 18:04:21
【问题描述】:
from sklearn.svm import LinearSVC
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.feature_extraction.text import TfidfTransformer
from sklearn.metrics import accuracy_score
X = data['Review']
y = data['Category']
tfidf = TfidfVectorizer(ngram_range=(1,1))
classifier = LinearSVC()
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.3)
clf = Pipeline([
('tfidf', tfidf),
('clf', classifier)
])
clf.fit(X_train, y_train)
y_pred = clf.predict(X_test)
print(classification_report(y_test, y_pred))
accuracy_score(y_test, y_pred)
这是训练模型和预测的代码。我需要知道我的模型性能。那我应该在哪里改成cross_val_score呢?
【问题讨论】:
-
以及如何使用classification_report(y_test, y_pred)打印每个交叉验证结果??
-
1) 没有“正常”的机器学习技术 2) 请花一些时间学习如何正确格式化您的代码。 3) 不要使用 cmets 来更新问题 - 而是编辑和更新问题。
-
嗨,好的,这是我第一次这样做。对不起,谢谢。
标签: python machine-learning scikit-learn data-science cross-validation