我的模型的损失值下降缓慢。如何在训练时更快地减少损失？答案

【问题标题】：My model's loss value decreases slowly .how to reduce my loss faster while training?我的模型的损失值下降缓慢。如何在训练时更快地减少损失？
【发布时间】：2020-01-26 14:12:15
【问题描述】：

当我训练模型时，损失在 2500 个时期内从 0.9 减少到 0.5。正常吗？

我的模特：

    model = Sequential()

    model.add(Embedding(vocab_size , emd_dim, weights=[emd_matrix], input_length=maxLen,trainable=False))

    model.add(LSTM(256,return_sequences=True,activation="relu",kernel_regularizer=regularizers.l2(0.01),kernel_initializer=keras.initializers.glorot_normal(seed=None)))
    model.add(LSTM(256,return_sequences=True,activation="relu",kernel_regularizer=regularizers.l2(0.01),kernel_initializer=keras.initializers.glorot_normal(seed=None)))

    model.add(LSTM(256,return_sequences=False,activation="relu",kernel_regularizer=regularizers.l2(0.01),kernel_initializer=keras.initializers.glorot_normal(seed=None)))
    model.add(Dense(l_h2i,activation='softmax'))
    model.compile(loss='categorical_crossentropy', optimizer="adam", metrics=['accuracy'])
    filepath = "F:/checkpoints/"+modelname+"/lstm-{epoch:02d}-{loss:0.3f}-{acc:0.3f}-{val_loss:0.3f}-{val_acc:0.3f}.hdf5"
    checkpoint = ModelCheckpoint(filepath, monitor="loss", verbose=1, save_best_only=True, mode='min')
    reduce_lr = ReduceLROnPlateau(monitor='loss', factor=0.5, patience=2, min_lr=0.000001)
    print(model.summary())
    history=model.fit(X_train_indices, Y_train_oh, batch_size=batch_size ,
                      epochs=epochs , validation_split=0.1, shuffle=True,
                      callbacks=[checkpoint, reduce_lr])

部分结果如下所示：

loss improved from 0.54275 to 0.54272
loss: 0.5427 - acc: 0.8524 - val_loss: 1.1198 - val_acc: 0.7610

loss improved from 0.54272 to 0.54268
loss: 0.5427 - acc: 0.8525 - val_loss: 1.1195 - val_acc: 0.7311

loss improved from 0.54268 to 0.54251
loss: 0.5425 - acc: 0.8519 - val_loss: 1.1218 - val_acc: 0.7420

loss improved from 0.54251 to 0.54249
loss: 0.5425 - acc: 0.8517 - val_loss: 1.1210 - val_acc: 0.7518

【问题讨论】：

您解决问题了吗？我也遇到了同样的问题
还没有，我正在努力解决一些其他类型的问题，如果您在实现时与我分享您的解决方案，将不胜感激。 @basilisk

标签： tensorflow keras neural-network deep-learning nlp

【解决方案1】：

考虑像TensorFlow documentation 一样更新ReduceLROnPlateau 参数。因素应该更大，耐心应该更小

reduce_lr = ReduceLROnPlateau(monitor='val_loss', factor=0.2,
                              patience=5, min_lr=0.001)
model.fit(X_train, Y_train, callbacks=[reduce_lr])

参数：

monitor：要监控的数量。

因素：降低学习率的因素。 new_lr = lr * 因子

耐心：没有改善的时期数，之后学习率将降低。

详细：int。 0：安静，1：更新消息。

模式：{auto, min, max} 之一。在 min 模式下，当监控的数量停止减少时，lr 将减少；在最大模式下它会当监测的数量停止增加时减少；在自动模式，根据名称自动推断方向被监控的数量。

min_delta：衡量新优化的阈值，仅关注重大变化。

冷却时间：减少 lr 后恢复正常操作之前要等待的 epoch 数。

min_lr：学习率的下限。

【讨论】：

我按你说的改了，但没有解决问题。
能否设置 min_lr=.01 再试一次
它也没有改变条件。