【发布时间】:2018-11-27 08:43:58
【问题描述】:
我正在做一个 tensorflow 项目,其中我在强化学习系统中有一个神经网络,用于预测 Q 值。我有 50 个输入和 10 个输出。一些输入在 30-70 的范围内,其余的在 0-1 之间,所以我只对第一组进行归一化,使用这个公式:
x_new = (x - x_min)/(x_max - x_min)
虽然我知道神经网络的数学基础,但我没有在实际案例中应用它们的经验,所以我真的不知道我使用的超参数是否正确选择。我目前拥有的是:
- 2 个隐藏层,每个隐藏层有 10 个和 20 个神经元
- 0.5 的学习率
- 批量大小为 10(我尝试了不同的值,直到 256 获得相同的结果)
我无法解决的问题是该神经网络的权重仅在前两到三轮迭代中发生变化,之后保持不变。
我在其他帖子中读到的是,该算法正在寻找局部最优值,输入的标准化是解决它的好主意。但是,在规范化输入之后,我仍然处于相同的状态。所以,我的问题是,是否有人知道问题可能出在哪里,以及是否有任何其他技术(如规范化)我应该添加到我的管道中。
我没有在问题中添加任何代码行,因为我认为我的问题是相当概念性的。但是,如果需要更多详细信息,我会插入它。
【问题讨论】:
标签: tensorflow machine-learning neural-network deep-learning reinforcement-learning