【发布时间】:2017-02-15 15:47:42
【问题描述】:
我想训练一个模型来生成文本,类似于this blog post
据我所知,此模型使用以下架构
[单词索引序列] -> [Embedding] -> [LSTM] -> [1 Hot Encoded "next word"]
基本上,作者将该过程建模为分类问题,其中输出层的维度与语料库中的单词一样多。
我想将这个过程建模为回归问题,通过重新使用学习的嵌入,然后最小化预测嵌入和实际嵌入之间的距离。
基本上:
[单词索引序列] -> [Embedding] -> [LSTM] -> [Embedding-Vector of the "next word"]
我的问题是,由于模型正在动态学习嵌入,我如何以与输入输入(作为单词索引)相同的方式输入输出,然后告诉模型“但在使用输出之前,用它的嵌入向量替换它?
非常感谢大家的帮助:-)
【问题讨论】:
-
你搞定了吗?如果是这样,任何指向代码/博客的链接(甚至是自我回答) - 正确标记的答案仅显示分类方法,而不是您想要执行的回归方法。
标签: python tensorflow deep-learning keras lstm