【发布时间】:2018-06-27 11:04:52
【问题描述】:
我想创建一个模型,可以预测句子中缺少的单词(句子有一个需要填充的整体)
我的数据集由 ~1000 个句子组成,最短的句子长度=6,最长的句子长度 ~120000。数据集的词汇量只有90。
模型具有 onehot 编码或预训练的 word2vec (gensim) 模型是否会产生巨大差异?我在 keras 嵌入层中使用预训练的权重:“冻结”(不可训练)该层的意义是什么,因为它对我的情况的准确性没有任何影响?
我尝试了两种表示方法,但我的测试数据的准确性似乎没有区别。我达到的最高准确率是正确预测的 55%。
我是在正确的轨道上还是执行该任务的方法错误?我的机器很慢,这使得参数实验变得非常困难和耗时。
如果您有任何建议或提示,我将不胜感激!
【问题讨论】:
标签: keras deep-learning lstm prediction word2vec