【发布时间】:2018-01-31 17:13:02
【问题描述】:
我在 Theano 之上使用 Keras 来创建一个 MLP,我训练并使用它来预测时间序列。与我的网络的结构和深度无关,我无法弄清楚(Keras 文档、StackOverflow、搜索网络……)Keras 的model.fit() 函数正在使用哪种训练算法(反向传播……)。
在 Theano 中(之前没有使用 Keras)我可以定义自己调整参数的方式
self.train_step = theano.function(inputs=[u_in, t_in, lrate], outputs=[cost, y],
on_unused_input='warn',
updates=[(p, p - lrate * g) for p, g in zip(self.parameters, self.gradients)],
allow_input_downcast=True)
找不到任何信息会导致我担心我遗漏了一些重要的东西,这可能是一个完全愚蠢的问题。
有人可以帮我吗?提前非常感谢。
【问题讨论】:
-
这取决于优化器。也许看看optimizers.py?您提供的 Theano 更新规则应等同于
SGD(momentum=0., nesterov=False)。 -
在keras中,训练算法和损失函数在“model.compile”方法中进行了调整。
-
谢谢大家。关于这个话题我找到了一篇可以推荐的文章:arxiv.org/abs/1609.04747
标签: machine-learning deep-learning keras theano