LSTM训练无法收敛

LSTM不收敛问题

问题描述
我准备用LSTM建立一个关于时序数据的映射问题，简单点来说就是输入一段有序的数据，经过LSTM之后输出另一段有序的数据，例如输入一段行走的动画骨架数据，输出一段跑的骨架数据。
我的方法
使用了三层的LSTM,将走的数据当作输入，跑的数据当做标签，将网络输出的结果和我的标签数据进行对比（使用了MSE损失函数），然后反向传播改进网络。
我的问题
网络不收敛，损失函数下降到0.02左右就不下降了，如下图所示，数据量是够的，学习率也非常的小，0.00001，我是过加入batch normalize,没有什么效果，各位大神们有什么建议和经验之谈吗？望不吝赐教，谢谢大家了！！！

LSTM训练无法收敛

相关文章：

猜你喜欢

相关资源

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode