高斯进度回归用例答案

【问题标题】：Gaussian Progress Regression usecase高斯进度回归用例
【发布时间】：2020-05-09 03:46:06
【问题描述】：

在阅读论文时：“基于触觉的主动对象识别和未知工作空间中的目标对象搜索”，有一些我无法理解：

这篇论文是关于仅使用触觉信息来查找对象的位置和其他属性的。在第 4.1.2 节中，作者说他使用 GPR 来指导探索过程，在第 4.1.4 节中他描述了他如何训练他的 GPR：

使用第 4.1.2 节中的示例，输入为 (x,z)，输出为 y。
只要有联系，就会存储相应的 y 值。
此过程重复多次。
这个经过训练的 GPR 用于估计下一个探索点，即方差最大的点。

在以下链接中，您还可以看到演示：https://www.youtube.com/watch?v=ZiLq3i-BJcA&t=177s。在视频的第一部分 (0:24-0:29)，第一次初始化发生在机器人采样 4 次的地方。然后在接下来的 25 秒内，机器人从相应的方向进行探索探索。我不明白 GPR 的这种微小初始化如何指导探索过程。有人可以解释一下如何估计第一个探索部分的输入点 (x,z) 吗？

【问题讨论】：

标签： machine-learning regression gaussian robotics non-linear-regression

【解决方案1】：

任何回归算法都只是以特定算法独有的方式将输入 (x,z) 映射到输出 y。对于新输入(x0,z0)，如果训练中包含许多与此类似的数据点，该算法可能会预测非常接近真实输出y0 的东西。如果只有在完全不同的地区有训练数据可用，那么预测可能会非常糟糕。

GPR 包括对预测置信度的度量，即方差。在之前没有看到过训练数据的区域中，方差自然会非常高，而在非常接近已经看到的数据点的区域中，方差会非常低。如果“实验”比评估高斯过程花费的时间长得多，您可以使用高斯过程拟合来确保对您的答案非常不确定的区域进行抽样。

如果目标是充分探索整个输入空间，您可以绘制大量(x,z) 的随机值并评估这些值的方差。然后您可以在y 中您最不确定的输入点执行昂贵的实验。然后，您可以使用迄今为止所有探索过的数据重新训练 GPR 并重复该过程。

针对优化问题（不是 OP 的问题）

如果您希望在整个输入空间中找到y 的最小值，您对在您知道y 值较高的区域进行实验不感兴趣，但您只是不确定这些值会有多高。因此，您可以选择y 的预测值加上一个标准差，而不是选择具有最高方差的(x,z) 点。以这种方式最小化值称为贝叶斯优化，这种特定方案称为上置信区间 (UCB)。预期改进 (EI) - 提高之前最好成绩的概率 - 也很常用。

【讨论】：

如果我理解正确的话，论文中的方法利用了机器人在训练/探索阶段没有出现的区域具有更高的方差值并将机器人引导到这些区域的事实。
然后忽略最后一段的后半部分（见编辑）。我将其包括在内以完成。
很抱歉问了一个额外的问题，但是如果我的目标是从训练中检查环境怎么办？因此，在训练之后，我将有一个 GPR 模型，我用多个 (x,z) 点训练并对应于环境，将估计训练标签 (Output) y。之后我如何引导机器人？通过给出一个新的点 (x1,z1)，我可以用 (y1-y) 来检查偏差，但是我可以以某种更系统的方式使用方差来做到这一点吗？
对于给定的新点(x1,z1)，您的 GP 将输出预期的方差。如果您以这种方式评估 1000 个随机点的方差，您可以选择在 GP 期望具有最大方差的点上进行实际实验（然后重新训练，获得下一个点等）。方差由 GP 预测，因此您无需进行额外的实验来估计这一点。不要与您的预测和实验结果之间的差异相混淆。
在上面评论中描述的情况下，GPR_1 在 environment_1 中进行了训练。在 environment_2 中，我想测量这些环境的不同之处。如果我用 GPR_1 评估来自 environement_2 的点 (x2,z2) 的方差，我可以自动测量这两个环境之间的差异。但是例如，当我为下一个点 (x2,z2)_2 重新训练 GPR_1 时，GPR_1 将被更改（我的参考环境模型被更改）。或者没关系，因为我只是用 GPR_1 和点 (x2,z2) 观察 max_variances。