【发布时间】:2022-01-12 03:47:47
【问题描述】:
我的X_train 功能是'Gender', 'Age', 'Leisure', 'Married', 'Division'
& y_train 是'Online Shopping'
我的最后一部分代码是这样的 -
from sklearn.ensemble import RandomForestClassifier
#rfc_100 = RandomForestClassifier(n_estimators=100, random_state=0)
rfc = RandomForestClassifier(random_state=0)
# fit the model
rfc.fit(X_train, y_train)
# Predict the Test set results
y_pred = rfc.predict(X_test)
# Check accuracy score
from sklearn.metrics import accuracy_score
print('Model accuracy score with 10 decision-trees : {0:0.4f}'. format(accuracy_score(y_test, y_pred)))
现在我的问题是如何使用这个已经构建的模型并检查预测?例如,我想提供这样的输入'Son 19-30 Games Yes C' & 我想看看对在线购物兴趣的预测是什么。输出应该是是或否。
编码过程-
#Labeling
import category_encoders as ce
encoder1 = ce.OrdinalEncoder(cols=['Gender', 'Age', 'Leisure', 'Married', 'Division'])
X_train = encoder1.fit_transform(X)
X_test = encoder1.transform(X)
encoder2= ce.OrdinalEncoder(cols=['Online Shopping'])
#y_test is True Online Shopping labels
#y_pred is predicted Online Shopping label in test set
y_train = encoder2.fit_transform(y)
y_test = encoder2.transform(y)
【问题讨论】:
-
你试过
rfc.predict吗? -
没有。它是否返回自定义输入的输出?
-
另外,我需要在这里先将“Son 19-30 Games Yes C”转换为标签
-
是的,它确实返回自定义输入的输出。您必须以与构造
X_test相同的方式构造“Son 19-30 Games Yes C”,除了一个数据点 -
我已经使用类别编码器来构造 x_test。所以如果我在这里再次对新数据帧使用类别编码器,那么标签将不会和以前一样。
标签: python machine-learning dataset random-forest