随机bandit问题特征是

UCB1算法

  1. 算法描述
    Stochastic Bandit Problem

  2. Bound分析

  3. 注意

UCB2算法

  1. 算法描述
  2. Bound分析
  3. 注意

/epsilon -greedy算法

  1. 算法描述
  2. Bound分析
  3. 注意

Soft-max算法

  1. 算法描述
  2. Bound分析
  3. 注意

Thompson - Sampling算法

  1. 算法描述
  2. Bound分析
  3. 注意

相关文章: