【发布时间】:2013-12-10 15:28:03
【问题描述】:
我正在做推文分类,其中每条推文都可以属于少数类别之一。 训练集输出作为该样本属于每个类别的概率给出。 例如:tweet#1:C1-0.6、C2-0.4、C3-0.0(C1、C2、C3 是类)
我打算通过 Scikit-learn 使用朴素贝叶斯分类器。我在 naive_bayes.py 中找不到适合的方法,该方法采用每个类的概率进行训练。 我需要一个分类器,它接受训练集的每个类的输出概率。 (即:y.shape = [n_samples, n_classes])
如何处理我的数据集以应用 NaiveBayes 分类器?
【问题讨论】:
标签: machine-learning scikit-learn document-classification