【发布时间】:2016-06-09 17:31:09
【问题描述】:
我发现 Theano/Lasagne 的所有示例都处理像 mnist 和 cifar10 这样的小型数据集,可以完全加载到内存中。
我的问题是如何编写高效的代码来训练大规模数据集? 具体来说,准备小批量(包括实时数据增强)以保持 GPU 忙碌的最佳方法是什么?
也许喜欢使用 CAFFE 的 ImageDataLayer? 例如,我有一个包含所有图像路径和标签的大 txt 文件。 如果能显示一些代码将不胜感激。
非常感谢!
【问题讨论】:
标签: theano deep-learning lasagne