【发布时间】:2020-04-29 06:39:28
【问题描述】:
我的问题如下: 输入:[字符序列]
输出:[字符序列]
输入和输出都是 BOW 表示。
例如 X=[12,3,4,5,6] ---> Y= [1,4,5,7,8]
我计划使用 Keras LSTM 完成上述任务。
我的损失函数应该是什么?
【问题讨论】:
标签: keras lstm recurrent-neural-network
我的问题如下: 输入:[字符序列]
输出:[字符序列]
输入和输出都是 BOW 表示。
例如 X=[12,3,4,5,6] ---> Y= [1,4,5,7,8]
我计划使用 Keras LSTM 完成上述任务。
我的损失函数应该是什么?
【问题讨论】:
标签: keras lstm recurrent-neural-network
最标准的方法是使用softmax对输出分布进行建模,合适的损失函数是分类交叉熵。
标准分类交叉熵期望目标是单热向量。如果要直接使用Y 中的索引,请使用稀疏分类交叉熵。
(参见this tutorial 中的示例二,它似乎完全符合您的要求。)
【讨论】: