【问题标题】:Suggestions for building tensorflow seq2seq 'lite' model/dataset构建 tensorflow seq2seq 'lite' 模型/数据集的建议
【发布时间】:2016-01-16 18:12:45
【问题描述】:

我想运行 tensorflow seq2seq 教程,但不想使用大量内存。我现在不关心性能 - 我对调试更感兴趣。有什么建议吗?

作为背景,我正在使用 seq2seq 教程 here(并希望进行修改):

【问题讨论】:

  • 您能否详细说明大量内存? 100M 1G 10G?
  • 你指的是内存还是存储空间?我最初了解 RAM,但现在想知道问题是否不在于存储和处理 20G 的数据。如果是后者,如何获取该文件,将其切片为您可以分配的大小,并且只使用切片?当然,模型的性能会受到影响。

标签: tensorflow


【解决方案1】:

使用更小的输入文件、词汇大小、嵌入大小和/或层数运行它。

尝试在 [your_data_directory] ​​中使用较小的训练文件...

> head -10000 giga-fren.release2.fr > giga-fren.release2.fr
> head -10000 giga-fren.release2.en > giga-fren.release2.en

尝试使用较小的词汇量,例如 1000...

python translate.py
--data_dir [your_data_directory] --train_dir [checkpoints_directory]
--en_vocab_size=1000 --fr_vocab_size=1000

尝试更小的嵌入尺寸和/或更少的层数

python translate.py
--data_dir [your_data_directory] --train_dir [checkpoints_directory]
--size=128 --num_layers=1 --steps_per_checkpoint=50

模型表现不佳,但运行速度更快,占用空间更小。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2019-12-11
    • 1970-01-01
    • 1970-01-01
    • 2020-01-17
    • 1970-01-01
    • 1970-01-01
    • 2017-09-01
    • 2018-02-24
    相关资源
    最近更新 更多