【发布时间】:2016-04-02 09:04:27
【问题描述】:
我使用 VGG 16 层 Caffe 模型来制作图片说明,每张图片都有多个说明。现在,我想从这些字幕(单词)中生成一个句子。
我在一篇关于 LSTM 的论文中读到,我应该从训练网络中移除 SoftMax 层,并将 fc7 层中的 4096 特征向量直接提供给 LSTM。
我是 LSTM 和 RNN 的新手。
我应该从哪里开始?有没有教程展示如何通过序列标签生成句子?
【问题讨论】:
标签: deep-learning caffe word2vec lstm recurrent-neural-network