【发布时间】:2017-06-21 03:53:03
【问题描述】:
我正在使用 SVM (scikit) 训练和测试数据。我正在训练 SVM 并从中准备一个泡菜。然后,我用那个泡菜来测试我的系统。首先,我分别读取变量train_data 和test_data 中的训练数据和测试数据。
之后,我用于训练的代码是:
vectorizer = TfidfVectorizer(max_df = 0.8,
sublinear_tf=True,
use_idf=True)
train_vectors = vectorizer.fit_transform(train_data)
test_vectors = vectorizer.transform(test_data)
classifier_rbf = svm.SVC()
classifier_rbf.fit(train_vectors, train_labels)
from sklearn.externals import joblib
joblib.dump(classifier_rbf, 'pickl/train_rbf_SVM.pkl',1)
再次在测试时,我分别读取变量train_data 和test_data 中的训练数据和测试数据。我用于测试的代码是:
vectorizer = TfidfVectorizer(max_df = 0.8,
sublinear_tf=True,
use_idf=True)
train_vectors = vectorizer.fit_transform(train_data)
test_vectors = vectorizer.transform(test_data)
from sklearn.externals import joblib
classifier_rbf = joblib.load('pickl/train_rbf_SVM.pkl')
prediction_rbf = classifier_rbf.predict(test_vectors)
此代码运行良好,并为我提供了正确的输出。我的问题是 - 每当我想进行测试时,是否必须阅读训练数据?
谢谢。
【问题讨论】:
标签: python scikit-learn svm