文本分类测试 NLTK python答案

【问题标题】：Text Categorization Test NLTK python文本分类测试 NLTK python
【发布时间】：2018-09-04 04:56:30
【问题描述】：

我使用 nltk 包并使用朴素贝叶斯训练模型。我已经使用 pickle 包将模型保存到文件中。现在我想知道如何使用这个模型像不在数据集中的随机文本一样进行测试，并且模型会判断句子是否属于哪个类别？

就像我的想法一样，我有一个句子：“罗纳尔多在对阵埃及的比赛中打进 2 球”并将其传递到模型文件并返回分类“运动”。

【问题讨论】：

您至少需要提供一些代码来说明您的数据和第一次操作以查看您的期望
看看kaggle.com/alvations/basic-nlp-with-nltk（无耻塞）

【解决方案1】：

仅保存模型无济于事。您还应该保存您的 VectorModel（例如 tfidfvectorizer 或 countvectorizer 用于拟合训练数据的任何内容）。您可以使用 pickle 以相同的方式保存这些内容。还要保存您用于预处理训练数据的所有模型，例如标准化/缩放模型等。对于测试数据，通过加载您保存的泡菜模型并以您使用的训练数据格式转换测试数据重复相同的步骤用于模型构建，然后您就可以进行分类了。

【讨论】：

感谢您的解决方案