为序列分类问题选择哪个损失函数？

【问题标题】：Which Loss function to choose for Sequence Classification Problem?为序列分类问题选择哪个损失函数？
【发布时间】：2020-04-29 06:39:28
【问题描述】：

我的问题如下：输入：[字符序列]

输出：[字符序列]

输入和输出都是 BOW 表示。

例如 X=[12,3,4,5,6] ---> Y= [1,4,5,7,8]

我计划使用 Keras LSTM 完成上述任务。

我的损失函数应该是什么？

【问题讨论】：

【解决方案1】：

最标准的方法是使用softmax对输出分布进行建模，合适的损失函数是分类交叉熵。

标准分类交叉熵期望目标是单热向量。如果要直接使用Y 中的索引，请使用稀疏分类交叉熵。

（参见this tutorial 中的示例二，它似乎完全符合您的要求。）

【讨论】：