【发布时间】:2018-10-03 23:22:41
【问题描述】:
sklearn nDcg的输入格式看不懂:http://sklearn.apachecn.org/en/0.19.0/modules/generated/sklearn.metrics.ndcg_score.html
目前我有以下问题:我有多个查询,每个查询的排名概率都已成功计算。但现在问题是为我想使用 sklearn nDcg 的测试集计算 nDCG。链接上给出的示例
>>> y_true = [1, 0, 2]
>>> y_score = [[0.15, 0.55, 0.2], [0.7, 0.2, 0.1], [0.06, 0.04, 0.9]]
>>> ndcg_score(y_true, y_score, k=2)
1.0
根据网站,y_true 是基本事实,y_score 是概率。所以以下是我的问题:
- 此示例仅适用于一个查询还是多个查询?
- 如果这只是一个查询,那么 y_true 代表什么:原始排名?
- 如果这是针对单个查询,为什么我们有多个输入概率?
- 如何将此方法应用于多个查询及其结果概率?
【问题讨论】:
标签: python machine-learning scikit-learn ranking xgboost