lstm网络用于句子生成的4个问题答案

【问题标题】：4 Questions to lstm network for sentence generationlstm网络用于句子生成的4个问题
【发布时间】：2019-02-02 07:16:16
【问题描述】：

警告：我是深度学习新手

我在一个笑话数据集（231657 个笑话）上训练我的两层 Lstm 模型，并想知道 4 件事：

如果我希望它生成新的笑话，我现在每句训练 50 个字符，我需要先输入 50 个字符还是我可以随机选择一个字符来开始句子/笑话？
对于 1.8 mio 仅使用 50 个字符对其进行训练不是很有用吗？总共（向量是 [10800001, 50, 1]）还是很好？
我使用了一个类，如果我初始化了我的模型，所以我可以调用它，不幸的是如果我想创建一个长句子/多个句子，我必须多次调用我的预测语句，问题是我的预测语句先初始化模型，然后预测值，所以我必须使用tf.reset_default_graph()，但是过一段时间，它需要更长的时间。那么我应该怎么做才能防止这个问题呢？我应该在主脚本或类似的东西中初始化模型吗？
如何解决文本增长的问题？我目前采用输入的形状并将其用于我的课程中的模型初始化，但这是个好主意吗？

【问题讨论】：

【解决方案1】：

您需要首先输入 50 个字符的种子序列。
我建议您增加序列长度。
我不太了解您，但我建议您正确构建模型。阅读更多信息：https://danijar.com/structuring-your-tensorflow-models/
再次，我建议您阅读上面的链接。

并不总是需要将您的模型作为一个类。您可以通过程序方式制作一次模型，对其进行训练，然后使用 tf.Saver() 保存它

【讨论】：