NLTK 确定性度量？答案

【问题标题】：NLTK certainty measure?NLTK 确定性度量？
【发布时间】：2012-03-06 11:45:35
【问题描述】：

在 NLTK 中，如果我为电影评论编写 NaiveBayes 分类器（确定是正面还是负面），在对特定评论进行分类时如何确定分类器“确定性”？也就是说，我知道如何在给定的测试集上运行“准确度”测试，以查看分类器的总体准确度。但是有没有 NLTk 输出它的确定性？（也许是基于信息量最大的特征……）

谢谢一个

【问题讨论】：

【解决方案1】：

我不确定朴素贝叶斯的 NLTK 实现，但朴素贝叶斯算法输出类成员的概率。但是，它们经过了可怕的校准。

如果您想要确定性的良好度量，您应该使用不同的分类算法。逻辑回归将在产生校准估计方面做得不错。

【讨论】：

【解决方案2】：

nltk.classify.util.log_likelihood。对于这个问题，你也可以尝试在token级别通过precision、recall、F-score来衡量结果，即分别对positive和negative进行评分。

【讨论】：