【发布时间】:2017-05-31 14:14:03
【问题描述】:
我有一个 scikit-learn 脚本来对一些广告进行分类并预测 CTR(点击率)。它适用于 1 个功能(文本)。不幸的是,其他一些事情很重要。例如:位置(这将存储在order.position)。
我在谷歌上搜索了很多,但我不知道如何:
- 添加第二个功能
-
将其添加到该行
text=["Order now - click here"]
以便我可以测试,例如:如果text="asdf" 和position = 3,点击率是多少。
这只是文本的工作代码,没有位置:
import pandas as pd
import numpy as np
X = orders.Text
y = orders.CTR
from sklearn.cross_validation import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=1)
from sklearn.feature_extraction.text import CountVectorizer
vect = CountVectorizer(analyzer='word')
vect.fit(X_train)
X_train_dtm = vect.transform(X_train)
X_test_dtm = vect.transform(X_test)
from sklearn.naive_bayes import MultinomialNB
clf = MultinomialNB()
clf.fit(X_train_dtm, y_train)
text=["Order now - click here"]
v_text = vect.transform(text).toarray()
erg=clf.predict(v_text)
print(erg)
【问题讨论】:
标签: python scikit-learn