【问题标题】:4 Questions to lstm network for sentence generationlstm网络用于句子生成的4个问题
【发布时间】:2019-02-02 07:16:16
【问题描述】:

警告:我是深度学习新手

我在一个笑话数据集(231657 个笑话)上训练我的两层 Lstm 模型,并想知道 4 件事:

  1. 如果我希望它生成新的笑话,我现在每句训练 50 个字符,我需要先输入 50 个字符还是我可以随机选择一个字符来开始句子/笑话?

  2. 对于 1.8 mio 仅使用 50 个字符对其进行训练不是很有用吗?总共(向量是 [10800001, 50, 1])还是很好?

  3. 我使用了一个类,如果我初始化了我的模型,所以我可以调用它,不幸的是如果我想创建一个长句子/多个句子,我必须多次调用我的预测语句,问题是我的预测语句先初始化模型,然后预测值,所以我必须使用tf.reset_default_graph(),但是过一段时间,它需要更长的时间。 那么我应该怎么做才能防止这个问题呢?我应该在主脚本或类似的东西中初始化模型吗?

  4. 如何解决文本增长的问题?我目前采用输入的形状并将其用于我的课程中的模型初始化,但这是个好主意吗?

【问题讨论】:

    标签: python-3.x neural-network lstm tflearn


    【解决方案1】:
    1. 您需要首先输入 50 个字符的种子序列。
    2. 我建议您增加序列长度。
    3. 我不太了解您,但我建议您正确构建模型。阅读更多信息:https://danijar.com/structuring-your-tensorflow-models/
    4. 再次,我建议您阅读上面的链接。

    并不总是需要将您的模型作为一个类。您可以通过程序方式制作一次模型,对其进行训练,然后使用 tf.Saver() 保存它

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2022-08-15
      • 2019-11-15
      • 1970-01-01
      • 2021-02-15
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多