【发布时间】:2012-03-06 11:45:35
【问题描述】:
在 NLTK 中,如果我为电影评论编写 NaiveBayes 分类器(确定是正面还是负面),在对特定评论进行分类时如何确定分类器“确定性”?也就是说,我知道如何在给定的测试集上运行“准确度”测试,以查看分类器的总体准确度。但是有没有 NLTk 输出它的确定性? (也许是基于信息量最大的特征……)
谢谢 一个
【问题讨论】:
标签: python classification nltk probability
在 NLTK 中,如果我为电影评论编写 NaiveBayes 分类器(确定是正面还是负面),在对特定评论进行分类时如何确定分类器“确定性”?也就是说,我知道如何在给定的测试集上运行“准确度”测试,以查看分类器的总体准确度。但是有没有 NLTk 输出它的确定性? (也许是基于信息量最大的特征……)
谢谢 一个
【问题讨论】:
标签: python classification nltk probability
我不确定朴素贝叶斯的 NLTK 实现,但朴素贝叶斯算法输出类成员的概率。但是,它们经过了可怕的校准。
如果您想要确定性的良好度量,您应该使用不同的分类算法。逻辑回归将在产生校准估计方面做得不错。
【讨论】:
nltk.classify.util.log_likelihood。对于这个问题,你也可以尝试在token级别通过precision、recall、F-score来衡量结果,即分别对positive和negative进行评分。
【讨论】: