Sparse Reward

经常是错误的动作，没有reward，只能随机动作，很慢

引导的reward

Sparse Reward

需要领域知识，与实际任务相关

Sparse Reward

好奇心reward——期待状态变化——重要的状态

network2是要从两个状态之间的到action，说明是重要的

Sparse Reward

Sparse Reward

train data要有顺序，从易到难——ML的通用技巧

Sparse Reward

阶层学习——大目标到小而具体的目标

Sparse Reward

Sparse Reward

Sparse Reward

黄色的是上层agent的目标，紫色的是上层agent给下层agent提出的目标。

相关文章：

2021-03-27
2021-07-31
2021-07-24
2022-12-23
2021-04-01
2021-08-04
2022-03-02
2022-12-23

猜你喜欢

2021-07-19
2021-07-14
2021-08-18
2021-10-17
2021-09-08
2021-11-26

相关资源

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode