【发布时间】:2014-07-12 05:09:42
【问题描述】:
我有两种方法可以对字符串列表进行不同的排名,我们可以认为是列表的“正确”排名(即黄金标准)。
换句话说:
ranked_list_of_strings_1 = method_1(list_of_strings)
ranked_list_of_strings_2 = method_2(list_of_strings)
correctly_ranked_list_of_strings # Some permutation of list_of_strings
考虑到method_1 和method_2 是黑匣子,我如何确定哪种方法更好? SciPy 或 scikit-learn 或类似的库中是否有任何方法可以测量这一点?
在我的具体情况下,我实际上有一个数据框,每个方法都会输出一个分数。重要的不是方法和真实分数之间的分数差异,而是方法获得正确的排名(分数越高意味着所有列的排名越高)。
strings scores_method_1 scores_method_2 true_scores
5714 aeSeOg 0.54 0.1 0.8
5741 NQXACs 0.15 0.3 0.4
5768 zsFZQi 0.57 0.7 0.2
【问题讨论】:
标签: python pandas scipy scikit-learn