【发布时间】:2019-11-20 14:30:10
【问题描述】:
我的数据集是餐馆评论,有两列评论和点赞。 根据评论显示他们是否喜欢这家餐厅
我在 NLP 中清理数据作为第一步。然后作为第二步使用如下的词袋模型。
from sklearn.feature_extraction.text import CountVectorizer
cv = CountVectorizer(max_features = 1500)
X = cv.fit_transform(corpus).toarray()
y = dataset.iloc[:, 1].values
根据我的数据集,上面给出的 X 为 1500 列,0 和 1,1000 行。
我预测如下
y_pred = classifier.predict(X_test)
所以现在我的评论是“食物很好”,我如何预测他们是否喜欢。一个单一的值来预测。
请您帮帮我。如果需要其他信息,请告诉我。
谢谢
【问题讨论】:
-
阅读关于情绪分析的词袋模型(正面和负面词)。仅供参考,这个论坛是发布用于调试的代码示例。您可能需要查看其他堆栈交换论坛,例如 datascience.stackexchange.com,以获得更好的建议。
标签: machine-learning nlp