【问题标题】:Classifying new occurances - Multinomial Naive Bayes对新事件进行分类 - 多项朴素贝叶斯
【发布时间】:2014-07-03 21:59:18
【问题描述】:

所以我目前使用[SKiLearn][1] 训练了多项朴素贝叶斯分类器 现在我可以做的是使用 predict 对测试数据进行分类。

但如果我想每晚运行这个脚本,我显然需要始终训练好分类器!现在我想做的是获取分类器系数、信息量词,并使用它们对新数据进行分类。

这可能吗 - 开发我自己的分类方法?还是我应该只是每晚训练 SkiLearn 分类器?

编辑:我可以做的一件事是保留和save my trained classifier

但是,通过逻辑回归,您可以获取系数并将其用于新数据。 NB有什么类似的吗?

【问题讨论】:

  • 我不明白你为什么不想在必要时保存和加载分类器。
  • “获取系数并将其用于新数据”是什么意思?所有机器学习算法都经过训练,然后用于预测未见数据的输出。

标签: python machine-learning classification scikit-learn


【解决方案1】:

你是说 [sklearn] 吗?你在用python吗?如果是这样的话,原来 [sklearn] 提供了一个获取模型参数的函数 [get_params(deep=True)] 以及一个设置它们的函数 [set_params(**params)]。

因此,可能的程序是:

训练阶段:

1) 训练模型

2) 使用get_params()获取模型的参数

3) 将参数保存到二进制文件中(例如使用pickle.dump())

预测阶段:

1) 从二进制文件中加载模型的参数(例如使用pickle.load())

2) 使用 set_params() 设置模型的参数

3) 使用 predict() 函数对新数据进行分类

希望对您有所帮助。

【讨论】:

    猜你喜欢
    • 2012-02-11
    • 2012-07-02
    • 2015-01-03
    • 2020-04-22
    • 2015-08-27
    • 2013-07-02
    • 2018-12-24
    • 2015-06-05
    • 2017-09-14
    相关资源
    最近更新 更多