【发布时间】:2019-08-21 06:48:12
【问题描述】:
我正在研究回归模型并评估模型性能,我的老板认为我们应该使用这个指标:
总绝对误差平均值 = mean(y_predicted) / mean(y_true) - 1
其中 mean(y_predicted) 是所有预测的平均值,mean(y_true) 是所有真实值的平均值。
我以前从未见过在机器学习中使用过这个指标,我说服他添加平均绝对百分比误差作为替代方案,尽管我的模型在 MAPE 方面表现更好,但当我们查看总绝对误差时,某些领域表现不佳平均值。
我的直觉是这个指标在显示真实准确性方面是错误的,但我似乎无法理解为什么。
总绝对误差平均值是一个有效的性能指标吗?如果不是,那为什么?如果是,为什么回归模型的准确度会在 MAPE 方面提高,但在总绝对误差均值方面却不提高?
提前谢谢你!
【问题讨论】:
-
我真的在质疑总绝对误差平均值的公式。你有任何来源或你是如何得出的?在我看来,单独计算预测的平均值并没有多大意义。通常你会计算差异的平均值(y_predicted - y_true)。该指标也称为平均绝对误差,是最基本的指标之一。
-
编辑了我的原始问题 - 它们不是单个值,而是值列表 - 该公式将 y_true 的平均值与 y_predicted 的平均值进行比较。这个公式是他在我开始工作之前为他的模型测量的东西,所以我猜这是他的想法。
-
我已经将其视为一个值列表,但我不认为进行总体平均有什么意义。我会改为使用更经典的 MAE 损失函数。
-
我同意,但我如何说服我的老板放弃这个指标?为什么在 MAE 旁边使用总平均值作为支持指标毫无意义?
标签: machine-learning statistics regression metrics