【发布时间】:2019-02-02 07:16:16
【问题描述】:
警告:我是深度学习新手
我在一个笑话数据集(231657 个笑话)上训练我的两层 Lstm 模型,并想知道 4 件事:
如果我希望它生成新的笑话,我现在每句训练 50 个字符,我需要先输入 50 个字符还是我可以随机选择一个字符来开始句子/笑话?
对于 1.8 mio 仅使用 50 个字符对其进行训练不是很有用吗?总共(向量是 [10800001, 50, 1])还是很好?
我使用了一个类,如果我初始化了我的模型,所以我可以调用它,不幸的是如果我想创建一个长句子/多个句子,我必须多次调用我的预测语句,问题是我的预测语句先初始化模型,然后预测值,所以我必须使用
tf.reset_default_graph(),但是过一段时间,它需要更长的时间。 那么我应该怎么做才能防止这个问题呢?我应该在主脚本或类似的东西中初始化模型吗?- 如何解决文本增长的问题?我目前采用输入的形状并将其用于我的课程中的模型初始化,但这是个好主意吗?
【问题讨论】:
标签: python-3.x neural-network lstm tflearn