【发布时间】:2021-12-19 19:14:33
【问题描述】:
我已经阅读了一些关于基于自我监督的强化学习的段落,它使代理能够在没有人工监督的情况下进行学习,以及未标记数据集训练的有效策略。但我多次找到“下游任务”。 现在,强化学习中的“下游任务”是什么意思?
【问题讨论】:
标签: reinforcement-learning self-supervised-learning
我已经阅读了一些关于基于自我监督的强化学习的段落,它使代理能够在没有人工监督的情况下进行学习,以及未标记数据集训练的有效策略。但我多次找到“下游任务”。 现在,强化学习中的“下游任务”是什么意思?
【问题讨论】:
标签: reinforcement-learning self-supervised-learning
下游任务是将通过任务特定奖励定义的任务。这通常是在长时间进行无监督 RL 预训练后完成的。
这种预训练通常需要自我监督,
【讨论】: