ai junkie 神经网络教程 - 不明白答案

【问题标题】：ai junkie neural networks tutorial - Not getting itai junkie 神经网络教程 - 不明白
【发布时间】：2015-05-16 22:52:15
【问题描述】：

我一直在努力理解http://www.ai-junkie.com/ann/evolved/nnt1.html的神经网络教程

我想我会按照教程的大部分内容一直到第 8 页（最后一页），虽然我可能没有这样做，因为如果我这样做了，我可能会理解最后一页，不是吗？对我来说不幸的是，这个页面没有得到很好的解释，因为它显然应该“从代码中的 cmets 很容易理解”。而且，该论坛似乎无法正常工作。

我想我希望已经看过或完成过本教程的人来帮助解释，但如果你还没有看过或想看一看，那就继续吧。基本上，它结合了神经网络和遗传算法，以便在小坦克四处扫雷时控制它们的左右轨道。神经网络将最近地雷的位置和坦克的方向（观察）向量作为输入，并输出左右坦克轨迹，用于更新坦克的速度和旋转。在一轮结束时，这些坦克被培育成新一代更好的坦克。

但是……我就是不明白。具体来说，我不明白坦克履带值与坦克拾取地雷的能力有何关系，我不明白不拾取的垃圾箱之间的差异任何地雷以及快速有效地扫雷的好地雷。

显然（如果您运行演示程序）坦克在模拟运行的时间越长越好。但是有人可以向我解释（希望引用 Tony Robinson 的话，用 Beano 读者可以理解的方式）到底发生了什么？

谢谢！

【问题讨论】：

输入是到最近矿井的转向位置和当前看向的方向，输出是转向强度。这样，NN 可以对其做出反应并设置适当的权重以正确引导。

标签： c++ machine-learning neural-network genetic-algorithm

【解决方案1】：

根据我对您问题的解释，这是我能给出的最佳答案。如果不是您要求的，请道歉，但您确实要求了最基本的解释。

我不明白坦克履带值与坦克来拾取地雷

坦克的工作方式是它有两条轨道——左和右。他们每个人都有一个速度。如果两条履带都全速前进，坦克将直线前进。如果左履带前移和右履带后移速度相同，则油箱将顺时针旋转。所以它基本上是一个复杂的控制机制，旨在使演习比坦克可以接受“向北移动一个正方形”类型的指令更有趣。

神经网络的重点是获取输入（当前坦克的方向和最近矿井的位置）并生成输出，以正确引导坦克通过其不稳定的左/右踏板控制朝向矿井。 NN 了解到，如果地雷在其右侧，则需要将左设置为“前进”，将右设置为“后退”，直到它指向地雷。然后它需要将左右都设置为“前进”，以便它实际上向矿井前进。

我不明白垃圾箱之间的区别捡起任何地雷和快速扫雷的好地雷高效。

垃圾箱没有正确的神经网络来正确引导垃圾箱。如果它在右侧看到一个地雷，它可能会从地雷向左旋转，因为它不“知道”如何向右转向。或者它可能会转离它已经指向的地雷，而不是朝着它移动。好人“知道”如何向地雷移动，也就是说，他们的 NN 以这样的方式加权，当给出最近的地雷的输入时，那些 NN 将倾向于向地雷移动而不是远离它.

【讨论】：

Euuuuurgh！（那是我患有动脉瘤的声音！）这正是我正在寻找的那种解释！你注意到了“特别”部分！哇。请在以后关注我的问题，以便您也可以回答！
很高兴能提供帮助...该教程将许多概念相互叠加，因此他们掩盖的“基本”内容最终会在整体组合中造成混淆也就不足为奇了.我自己肯定去过那里。