【问题标题】:Jupyter Notebook - Kernel dies during training - tensorflow-gpu 2.0, Python 3.6.8Jupyter Notebook - 内核在训练期间死亡 - tensorflow-gpu 2.0,Python 3.6.8
【发布时间】:2019-12-12 20:03:58
【问题描述】:

由于我是这个领域的新手,我尝试按照 tensorflow 的官方教程来预测时间序列。 https://www.tensorflow.org/tutorials/structured_data/time_series

出现以下问题: - 训练多变量模型时,在 2 或 3 个 epoch 后,内核死亡并重新启动。

然而,这不会发生在一个更简单的单变量模型中,它只有一个 LSTM 层(不确定这是否会有所不同)。

然而,第二个问题是今天才发生的。昨天多变量模型的训练是可能的并且没有错误。

从下面链接中的教程中可以看出,模型如下所示:

multi_step_model = tf.keras.models.Sequential()
multi_step_model.add(tf.keras.layers.LSTM(32,return_sequences=True,input_shape=x_train_multi.shape[-2:]))

multi_step_model.add(tf.keras.layers.LSTM(16, activation='relu'))

multi_step_model.add(tf.keras.layers.Dense(72))

multi_step_model.compile(optimizer=tf.keras.optimizers.RMSprop(clipvalue=1.0), loss='mae')

并且内核在执行以下单元后死亡(通常在 2 或 3 个 epoch 之后)。

multi_step_history = multi_step_model.fit(train_data_multi, epochs=10,
                                          steps_per_epoch=300,
                                          validation_data=val_data_multi,
                                          validation_steps=50)

我已经卸载并重新安装了 tf,重新启动了我的笔记本电脑,但似乎没有任何效果。

有什么想法吗?

操作系统:Windows 10 Surface Book 1

【问题讨论】:

    标签: python-3.x tensorflow jupyter-notebook


    【解决方案1】:

    问题是批量太大。将其从 1024 减少到 256 解决了崩溃问题。

    解决方案取自 rbwendt 对this thread on github 的评论。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2018-12-02
      • 1970-01-01
      • 2020-04-21
      • 2019-02-02
      • 2016-05-14
      • 1970-01-01
      相关资源
      最近更新 更多