【问题标题】:Text Categorization Test NLTK python文本分类测试 NLTK python
【发布时间】:2018-09-04 04:56:30
【问题描述】:

我使用 nltk 包并使用朴素贝叶斯训练模型。我已经使用 pickle 包将模型保存到文件中。现在我想知道如何使用这个模型像不在数据集中的随机文本一样进行测试,并且模型会判断句子是否属于哪个类别?

就像我的想法一样,我有一个句子:“罗纳尔多在对阵埃及的比赛中打进 2 球”并将其传递到模型文件并返回分类“运动”。

【问题讨论】:

标签: python nltk text-mining naivebayes


【解决方案1】:

仅保存模型无济于事。您还应该保存您的 VectorModel(例如 tfidfvectorizer 或 countvectorizer 用于拟合训练数据的任何内容)。您可以使用 pickle 以相同的方式保存这些内容。还要保存您用于预处理训练数据的所有模型,例如标准化/缩放模型等。对于测试数据,通过加载您保存的泡菜模型并以您使用的训练数据格式转换测试数据重复相同的步骤用于模型构建,然后您就可以进行分类了。

【讨论】:

  • 感谢您的解决方案
猜你喜欢
  • 2018-12-21
  • 2015-05-31
  • 2018-05-13
  • 2014-06-04
  • 2017-01-14
  • 2017-05-15
  • 2014-01-06
  • 1970-01-01
相关资源
最近更新 更多