【发布时间】:2018-02-23 15:16:55
【问题描述】:
使用不同的方法,我正在对文档及其标题进行评分。现在我想将所有这些分数汇总成一个分数(信心分数)。我想使用无监督的方法。我想要概率或百分比的置信度分数。
这里,M= 方法号,TS = 文档标题分数,CS = 文档内容分数
例如 1
Doc1(预期置信度得分接近 0)
M - TS - CS
1 - 0.03 - 0.004
2 - 0.054 - 0.06
3 - 0.09 - 0.12
Doc2(预期置信度得分接近 1)
M - TS - CS
1 - 0.50 - 0.63
2 - 0.74 - 0.90
3 - 0.615 - 0.833
这里我的假设是文档 1 的置信度分数应该接近于零,文档 2 的置信度分数应该接近 1。
也有可能所有文档的所有方法的分数都较低(例如 2),因此所有文档的置信度分数应该接近于零。
例如.2
Doc1(预期置信度得分接近 0)
M - TS - CS
1 - 0.03 - 0.004
2 - 0.054 - 0.06
3 - 0.09 - 0.12
Doc2(预期置信度得分接近 0)
M - TS - DS
1 - 0.001 - 0.003
2 - 0.004 - 0.005
3 - 0.0021 - 0.013
谁能解释我或提供一些资源来计算置信度分数?
【问题讨论】:
标签: python machine-learning deep-learning