对新事件进行分类 - 多项朴素贝叶斯答案

【问题标题】：Classifying new occurances - Multinomial Naive Bayes对新事件进行分类 - 多项朴素贝叶斯
【发布时间】：2014-07-03 21:59:18
【问题描述】：

所以我目前使用[SKiLearn][1] 训练了多项朴素贝叶斯分类器现在我可以做的是使用 predict 对测试数据进行分类。

但如果我想每晚运行这个脚本，我显然需要始终训练好分类器！现在我想做的是获取分类器系数、信息量词，并使用它们对新数据进行分类。

这可能吗 - 开发我自己的分类方法？还是我应该只是每晚训练 SkiLearn 分类器？

编辑：我可以做的一件事是保留和save my trained classifier。

但是，通过逻辑回归，您可以获取系数并将其用于新数据。 NB有什么类似的吗？

【问题讨论】：

【解决方案1】：

你是说 [sklearn] 吗？你在用python吗？如果是这样的话，原来 [sklearn] 提供了一个获取模型参数的函数 [get_params(deep=True)] 以及一个设置它们的函数 [set_params(**params)]。

因此，可能的程序是：

训练阶段：

1) 训练模型

2) 使用get_params()获取模型的参数

3) 将参数保存到二进制文件中（例如使用pickle.dump()）

预测阶段：

1) 从二进制文件中加载模型的参数（例如使用pickle.load()）

2) 使用 set_params() 设置模型的参数

3) 使用 predict() 函数对新数据进行分类

希望对您有所帮助。

【讨论】：