【发布时间】:2018-03-21 03:12:50
【问题描述】:
有时我会遇到问题:
用形状分配张量时的OOM
e.q.
分配形状为 (1024, 100, 160) 的张量时的 OOM
1024 是我的批量大小,我不知道其余的是什么。如果我减少批量大小或模型中的神经元数量,它运行良好。
是否有一种通用的方法可以根据模型和 GPU 内存计算最佳批量大小,从而使程序不会崩溃?
简而言之:就我的模型而言,我想要尽可能大的批处理大小,这将适合我的 GPU 内存并且不会使程序崩溃。
【问题讨论】:
标签: machine-learning neural-network deep-learning keras gradient-descent