【发布时间】:2018-12-04 03:20:16
【问题描述】:
我创建了一个 2-stacked LSTM 模型,我想在最近的英文维基百科文章转储(15.1 GB 文本)上对其进行训练。我无法将语料库加载到文本变量中以进行词嵌入。 Keras RNN 模型通常如何在如此庞大的文本语料库上进行训练以避免内存错误?
尝试打开 15.1 GB 文件后:
text = open('/home/connor/Desktop/wiki_en.txt').read().lower()
我收到此错误消息:
(结果,消耗)= self._buffer_decode(数据,self.errors,最终) 内存错误
【问题讨论】:
-
或者看看其他向您的网络提供数据的方式(例如,如果您使用 Tensorflow 的后端,则使用生成器或
tf.Datasets)
标签: python keras out-of-memory lstm rnn