为什么sklearn中的cross_val_score会翻转指标的值？答案

【问题标题】：Why does cross_val_score in sklearn flip the value of the metric?为什么sklearn中的cross_val_score会翻转指标的值？
【发布时间】：2019-04-22 05:27:03
【问题描述】：

我正在从sklearn 拟合这个模型。

LogisticRegressionCV(
        solver="sag", scoring="neg_log_loss", verbose=0, n_jobs=-1, cv=10
    )

拟合导致model.score（在训练集上）为 0.67 并发生变化。由于无法（或者我不知道如何）访问作为模型拟合的一部分执行的交叉验证的结果，因此我在同一模型上作为单独的交叉验证运行

cross_val_score(model, X, y, cv=10, scoring="neg_log_loss")

这会返回一个负数数组

[-0.69517214 -0.69211235 -0.64173978 -0.66429986 -0.77126878 -0.65127196
 -0.66302393 -0.65916281 -0.66893633 -0.67605681]

如果符号被翻转，它似乎在与训练分数兼容的范围内。我在issue 中阅读了关于cross_val_score 翻转给定评分函数符号的讨论，并且解决方案似乎引入了neg_* 指标以使这种翻转变得不必要，我正在使用neg_log_loss。该问题讨论了mse，但这些论点似乎也适用于log_loss。有没有办法让cross_val_score 返回与其参数中指定的相同的指标？或者这是我应该提交的错误？还是我的误解和符号更改仍然可以期待cross_val_score？

我希望这对 SO 来说是一个足够具体的问题。 Sklearn devs 将用户重定向到 SO 以解决不明确的错误报告或功能要求的问题。

在 cmets 中为每个请求添加最少的重现代码（sklearn v 0.19.1 python 2.7）：

from numpy.random import randn, seed
from sklearn.linear_model import LogisticRegressionCV
from sklearn.model_selection import cross_val_score

seed (0)
X = randn(100,2)
y = randn(100)>0
model = LogisticRegressionCV(
    solver="sag", scoring="neg_log_loss", verbose=0, n_jobs=-1, cv=10
)
model.fit(X=X, y=y)
model.score(X,y)

cross_val_score(model, X, y, cv=10, scoring="neg_log_loss")

使用此代码，它看起来不再像是度量标准的简单符号翻转。分数的输出为 0.59，交叉验证分数的输出为 array([-0.70578452, -0.68773683, -0.68627652, -0.69731349, -0.69198876, -0.70089103, -0.69476663, -0.68279466, -0.70066003, -0.68532253])。

【问题讨论】：

您能否展示完整的代码以及可能在model.score() 时重现正分数的一些数据？我无法在 scikit-learn 内置数据集上复制它。
完整代码在github.com/piccolbo/rightload branch basilica ML代码在ml.py 共享数据比较复杂，运行代码需要访问Web服务。我需要想出一些更独立的东西来进行更实际的复制。
生成正分数的代码非常简单，在 ml.py:127 和以下行中。 model.fit(X,y) 后跟 model.score(X,y)，差不多。我希望我得到了你的问题——当然，我还欠你一些完整的复制数据。
得到了复制，但它需要与数据共享两个泡菜。有没有一种首选的方式来做到这一点？
将repro 替换为独立且快速的repro。不过，它看起来不再像一个简单的标志翻转了。

标签： scikit-learn cross-validation loss-function

【解决方案1】：

注意：在Vivek Kumar 和piccolbo 的富有成效的评论线程之后编辑。

关于 LinearRegressionCV `score` 方法的奇怪结果

您发现了一个错误，该错误已在版本 0.20.0 中得到修复。

来自changelog：

修复：修复了 linear_model.LogisticRegressionCV 中 score 方法始终计算准确度的错误，而不是 score 参数给出的指标。 #10998 by Thomas Fan。

另外，sklearn 的 0.19 LogisticRegressionCV documentation 说：

score(X, y, sample_weight=None)

返回给定测试数据和标签的平均准确度。

虽然从版本 0.20.0 开始，docs 更新了错误修复：

score(X, y, sample_weight=None)

返回给定测试数据和标签的评分选项。

关于`cross_val_score`中返回的负值

cross_val_score 翻转 error 或 loss 指标的结果值，同时保留 score 指标的符号。来自documentation：

所有 scorer 对象都遵循较高返回值优于较低返回值的约定。因此，衡量模型和数据之间距离的指标，如 metrics.mean_squared_error，可以作为 neg_mean_squared_error 使用，它返回指标的否定值。

【讨论】：

我不明白为什么我得到了反对票。我降低了我的回答的自信度，以防这是问题所在。我认为它至少增加了有关该主题的有用信息。
是的。你是对的。 LogisticRegressionCV 返回mean accuracy in version 0.19。从 0.20 版本开始，它返回定义的 scoring 参数的分数。
升级sklearn问题解决。这是在一条似乎已经消失的评论中提出的，然后在朱利安的回答中提出，其中包含许多其他与恕我直言弱相关的东西。如果他可以将其简化为在最新 sklearn 版本中更改的准确度与要求的指标，我很乐意将其标记为已接受。谢谢！
@piccolbo 很高兴听到它解决了！这是一个非常棘手的场景。我对答案做了一些版本，删除了一些争论的转变，给出了相关的学分，保留了关于准确性问题的信息（并显示了关于此事的详细明确引用）以及关于cross_val_score 的符号翻转的信息（即不是微不足道的，而且似乎也有点相关，至少对于你在重现代码之前的问题的第一部分）。它看起来不错吗？有什么建议吗？
实际上，我在更新日志中找到了错误修复！！这是LogisticRegressionCV.score doesn't respect scoring, inconsistent with GridSearchCV。将此添加到答案中。

关于 LinearRegressionCV score 方法的奇怪结果

关于cross_val_score中返回的负值

关于 LinearRegressionCV `score` 方法的奇怪结果

关于`cross_val_score`中返回的负值