【发布时间】:2019-06-25 15:53:23
【问题描述】:
我已经成功运行了以 LSTM 作为第一层的模型。但出于好奇,我将 LSTM 替换为 CuDNNLSTM。 但是在model.fit之后,它回复了以下错误信息:
UnknownError: Fail to find the dnn implementation.
[[{{node cu_dnnlstm_5/CudnnRNN}} = CudnnRNN[T=DT_FLOAT, _class=["loc:@training_2/Adam/gradients/cu_dnnlstm_5/CudnnRNN_grad/CudnnRNNBackprop"], direction="unidirectional", dropout=0, input_mode="linear_input", is_training=true, rnn_mode="lstm", seed=87654321, seed2=0, _device="/job:localhost/replica:0/task:0/device:GPU:0"](cu_dnnlstm_5/transpose, cu_dnnlstm_5/ExpandDims_1, cu_dnnlstm_5/ExpandDims_1, cu_dnnlstm_5/concat_1)]]
[[{{node metrics_3/mean_squared_error/Mean_1/_1877}} = _Recv[client_terminated=false, recv_device="/job:localhost/replica:0/task:0/device:CPU:0", send_device="/job:localhost/replica:0/task:0/device:GPU:0", send_device_incarnation=1, tensor_name="edge_4852_metrics_3/mean_squared_error/Mean_1", tensor_type=DT_FLOAT, _device="/job:localhost/replica:0/task:0/device:CPU:0"]()]]
我已经在这个discussion 上尝试过TestCudnnLSTM() 并成功通过了测试:
Keras 版本:2.2.4 张量流版本:1.12.0 创建模型 _________________________________________________________________ 层(类型)输出形状参数# ==================================================== ================ cu_dnnlstm_1 (CuDNNLSTM) (无, 1000, 1) 16 ==================================================== ================ 总参数:16 可训练参数:16 不可训练参数:0 _________________________________________________________________ 没有 模型编译问题似乎是在模型拟合过程中出现的。但我不知道到底是什么问题?
【问题讨论】:
-
我在 tf 1.13 和 CuDNN 7.5 中也经常遇到这个问题。然而,它随机发生的几率只有大约 10%。通常我可以重新启动程序,它工作正常。