【发布时间】:2019-01-27 03:42:15
【问题描述】:
我想对我的 Keras 模型执行超参数优化。问题是数据集比较大,一般训练时我使用fit_generator从磁盘批量加载数据,但是SKlearn Gridsearch、Talos等常用包只支持fit方法。
我尝试使用以下方法将整个数据加载到内存中:
train_generator = train_datagen.flow_from_directory(
original_dir,
target_size=(img_height, img_width),
batch_size=train_nb,
class_mode='categorical')
X_train,y_train = train_generator.next()
但是在执行网格搜索时,操作系统会因为内存使用量大而将其杀死。 我还尝试将我的数据集欠采样到仅 25%,但它仍然太大。
有没有人和我有同样情况的经历?您能否分享一下您对大型数据集执行超参数优化的策略?
根据@dennis-ec 的回答,我尝试在这里学习 SkOpt 的教程:http://slashtutorial.com/ai/tensorflow/19_hyper-parameters/,这是一个非常全面的教程
【问题讨论】:
-
您可以将 fit_generator() 与 Talos 一起使用。在此处查看信息:stackoverflow.com/questions/53559068/…
标签: python optimization keras talos