强化学习是介于监督学习和非监督学习中间的一种学习方法。 不提供样本标签,对积极步进奖赏,求最大化奖赏,常处理序列效益优化问题。 相关文章: 2021-06-27 2021-09-04 2021-07-28 2021-05-17 2021-12-02 2021-07-10 2021-07-23 2021-09-18