为什么 Keras MAPE 指标在训练期间呈爆炸式增长，而 MSE 损失却没有？ [关闭]答案

【问题标题】：Why Keras MAPE metric is exploding during training but MSE loss is not? [closed]为什么 Keras MAPE 指标在训练期间呈爆炸式增长，而 MSE 损失却没有？ [关闭]
【发布时间】：2020-09-29 12:10:26
【问题描述】：

我在 Keras 中实现了一个带注意力的 LSTM 来重现 this paper。奇怪的行为很简单：我有一个 MSE 损失函数和一个 MAPE 和 MAE 作为指标。在训练期间，MAPE 正在爆炸，但 MSE 和 MAE 似乎训练正常：

Epoch 1/20
275/275 [==============================] - 191s 693ms/step - loss: 0.1005 - mape: 15794.8682 - mae: 0.2382 - val_loss: 0.0334 - val_mape: 24.9470 - val_mae: 0.1607
Epoch 2/20
275/275 [==============================] - 184s 669ms/step - loss: 0.0099 - mape: 6385.5464 - mae: 0.0725 - val_loss: 0.0078 - val_mape: 11.3268 - val_mae: 0.0803
Epoch 3/20
275/275 [==============================] - 186s 676ms/step - loss: 0.0025 - mape: 5909.3735 - mae: 0.0369 - val_loss: 0.0131 - val_mape: 14.9827 - val_mae: 0.1061
Epoch 4/20
275/275 [==============================] - 187s 678ms/step - loss: 0.0015 - mape: 4746.2788 - mae: 0.0278 - val_loss: 0.0142 - val_mape: 16.1894 - val_mae: 0.1122
Epoch 5/20
 30/275 [==>...........................] - ETA: 2:38 - loss: 0.0012 - mape: 9.3647 - mae: 0.0246

MAPE 在每个纪元结束时爆炸。这种特定行为的原因可能是什么？

MAPE 仍然随着每个 epoch 下降，所以这不是一个真正的问题，因为它没有阻碍训练过程？

【问题讨论】：

但是我可以看到 MAPE 正在减少。
@Peyman 它是，但是是什么导致了每个时代结束时的爆炸？它是否阻碍了培训过程？
可能不会。 MAPE 在其价值的意义上有点误导。 en.wikipedia.org/wiki/Mean_absolute_percentage_error#Issues

标签： python tensorflow keras lstm lstm-stateful

【解决方案1】：

您的损失和 MAPE 正在减少，所以听起来不错。但是，如果您担心 MAPE 中的高值，您可以判断 Y 值是否接近零。因为 MAPE 是一个百分比误差。

MAPE 结果可能会产生误导。来自Wikipedia：

虽然 MAPE 的概念听起来非常简单和令人信服，但它具有实际应用中的主要缺点，研究较多关于 MAPE 的缺点和误导性结果。

如果有零值（例如在需求数据中有时会发生），则不能使用它，因为会有除法零。

对于过低的预测，百分比误差不能超过 100%，但对于过高的预测，没有上限百分比误差。

MAPE 对负错误的惩罚比对正错误的惩罚要重。

为克服 MAPE 的这些问题，还有一些其他措施文献中提出：

平均绝对比例误差 (MASE)

对称平均绝对百分比误差 (sMAPE)

平均方向精度 (MDA)

平均反正切绝对百分比误差 (MAAPE)

【讨论】：