【问题标题】:CNTK - incomplete training of modelCNTK - 模型的不完整训练
【发布时间】:2017-03-10 07:01:48
【问题描述】:

我使用 CNTK python API 训练了一个三层前馈网络来玩一个简单的基于网格的棋盘游戏。如果我使用小板 (6 x 6) 网格,模型训练成功。该模型在 100 场比赛中以 100% 的成功率进行比赛。但是,如果我将棋盘大小增加到 21 x 21,训练似乎会饱和,在 100 场比赛中成功率约为 90%。

增加训练时间或改变训练参数似乎不会提高模型的性能。

  • 我错过了什么吗?
  • CNTK 是否支持使用“dropout”?
  • 还有其他技术可以改进训练

【问题讨论】:

    标签: python cntk


    【解决方案1】:

    是的,支持 dropout。当前文档位于此处:

    https://cntk.ai/pythondocs/cntk.ops.html?highlight=dropout#cntk.ops.dropout

    您使用的是哪种激活函数?如果您使用的是 Sigmoid,请尝试使用 ReLU。如果使用 ReLU,它们可能会在训练期间由于大梯度流动而死亡。尝试使用 Leaky ReLU 或 Param ReLU。工具包都支持这些。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2017-08-19
      相关资源
      最近更新 更多