【发布时间】:2015-05-16 22:52:15
【问题描述】:
我一直在努力理解http://www.ai-junkie.com/ann/evolved/nnt1.html的神经网络教程
我想我会按照教程的大部分内容一直到第 8 页(最后一页),虽然我可能没有这样做,因为如果我这样做了,我可能会理解最后一页,不是吗?对我来说不幸的是,这个页面没有得到很好的解释,因为它显然应该“从代码中的 cmets 很容易理解”。而且,该论坛似乎无法正常工作。
我想我希望已经看过或完成过本教程的人来帮助解释,但如果你还没有看过或想看一看,那就继续吧。基本上,它结合了神经网络和遗传算法,以便在小坦克四处扫雷时控制它们的左右轨道。神经网络将最近地雷的位置和坦克的方向(观察)向量作为输入,并输出左右坦克轨迹,用于更新坦克的速度和旋转。在一轮结束时,这些坦克被培育成新一代更好的坦克。
但是……我就是不明白。具体来说,我不明白坦克履带值与坦克拾取地雷的能力有何关系,我不明白不拾取的垃圾箱之间的差异任何地雷以及快速有效地扫雷的好地雷。
显然(如果您运行演示程序)坦克在模拟运行的时间越长越好。但是有人可以向我解释(希望引用 Tony Robinson 的话,用 Beano 读者可以理解的方式)到底发生了什么?
谢谢!
【问题讨论】:
-
输入是到最近矿井的转向位置和当前看向的方向,输出是转向强度。这样,NN 可以对其做出反应并设置适当的权重以正确引导。
标签: c++ machine-learning neural-network genetic-algorithm