【发布时间】:2019-09-10 18:39:12
【问题描述】:
我实际上是在尝试使用 TensorFlow 并使用 LSTM。 为此,我在文本文件 (10MB) 中有数据。
当我尝试在 numpy 中复制数据时,出现内存已满错误。
有什么建议可以让我准备好数据以便在 LSTM 中使用吗?
在使用此函数处理张量流之前从文件中读取数据:
def read_data(fname):
with open(fname,encoding="utf8") as f:
content = f.readlines()
content = [x.strip() for x in content]
content = [word for i in range(len(content)) for word in content[i].split()]
content = np.array(content)
return content
在np.array(content),它给出了内存已满错误。我怎样才能解决这个问题,以便我可以在 TensorFlow 的 LSTM 中使用这些数据?
还请建议是否有任何可以读取大量数据的LSTM
【问题讨论】:
-
请至少向我们展示您的文件的几行。
-
您应该重新表述您的问题。这与 LSTM 或 TensorFlow 无关。
标签: machine-learning nlp