构建 tensorflow seq2seq 'lite' 模型/数据集的建议

【问题标题】：Suggestions for building tensorflow seq2seq 'lite' model/dataset构建 tensorflow seq2seq 'lite' 模型/数据集的建议
【发布时间】：2016-01-16 18:12:45
【问题描述】：

我想运行 tensorflow seq2seq 教程，但不想使用大量内存。我现在不关心性能 - 我对调试更感兴趣。有什么建议吗？

作为背景，我正在使用 seq2seq 教程 here（并希望进行修改）：

【问题讨论】：

您能否详细说明大量内存？ 100M 1G 10G？
你指的是内存还是存储空间？我最初了解 RAM，但现在想知道问题是否不在于存储和处理 20G 的数据。如果是后者，如何获取该文件，将其切片为您可以分配的大小，并且只使用切片？当然，模型的性能会受到影响。

标签： tensorflow

【解决方案1】：

使用更小的输入文件、词汇大小、嵌入大小和/或层数运行它。

尝试在 [your_data_directory] 中使用较小的训练文件...

> head -10000 giga-fren.release2.fr > giga-fren.release2.fr
> head -10000 giga-fren.release2.en > giga-fren.release2.en

尝试使用较小的词汇量，例如 1000...

python translate.py
--data_dir [your_data_directory] --train_dir [checkpoints_directory]
--en_vocab_size=1000 --fr_vocab_size=1000

尝试更小的嵌入尺寸和/或更少的层数

python translate.py
--data_dir [your_data_directory] --train_dir [checkpoints_directory]
--size=128 --num_layers=1 --steps_per_checkpoint=50

模型表现不佳，但运行速度更快，占用空间更小。

【讨论】：