从 60D（形状上下文）空间投影到 2D 以进行视觉分析答案

【问题标题】：Projecting from 60D (shape context) space to 2D for visual analysis从 60D（形状上下文）空间投影到 2D 以进行视觉分析
【发布时间】：2011-07-16 19:14:04
【问题描述】：

我有一组 60D 形状的上下文向量。这些是使用来自轮廓的 400 个边缘点的样本构建的，使用 5 个径向箱和 12 个角度箱（因此，我有 400 个 60D 的形状上下文向量）。

我想分析这些向量在表示底层轮廓的整体形状方面的描述性。为此，我想将 60D 形状上下文向量投影回 2D 空间并目视检查结果——我希望看到的是一组与原始轮廓形状大致相似的点。

实现此目的的一种方法是对前两个主成分 (PCA) 进行投影。根据我的实现，投影点与轮廓的形状不同。我可以看到两个主要原因（暂时假设我的实现是正确的）：（1）形状上下文不适合作为给定轮廓的描述符，或者它的参数需要更好地调整（2）这个分析方法有缺陷/无效。

我的问题是，这是否是分析与我的剪影形状相关的形状上下文的描述性的正确方法？如果没有，有人可以解释原因并提出替代方法吗？

谢谢，

乔什

【问题讨论】：

【解决方案1】：

检查特征是否具有描述性的好方法是尝试在它们上训练一些分类器（svm/bayes/tree/whatever）并检查它的交叉验证精度/召回率等。您还可以通过以下方式过滤特征向量像 Chi/infogain 这样的特征选择器。

除了 PCA，您还可以使用 SOM 或通过聚类来可视化您的数据。

【讨论】：

感谢您的回复；正如建议的那样，我将使用形状上下文描述符来训练分类器，并查看我作为第一步获得的性能。您提到了对数据进行聚类，但是鉴于它是 60D，我如何将其可视化？
Cluster 可以使用流行的 Treemap 可视化和相关组将数据可视化为树（分层集群）。分类还为您提供了新的维度 - 您可以使用它们来查看分类器认为实例如何接近的类别的概率。

【解决方案2】：

我认为这种分析方法有缺陷/无效。我认为这将是一个类似的推理：我可以通过对每个足球运动员所看到的内容进行 PCA 来从上方重建足球场的视图。期望这样是不合理的。

我认为分析形状上下文的描述性最简单的方法是下载 MNIST 或其他一些书面数字的数据库，并计算 5 个 1 和 5 个 2 的形状相似度的 10x10 矩阵，然后使用 (说）graphviz。

【讨论】：

感谢足球场的类比；它使概念上发生的事情更加清晰。然而，我相信这个类比并不意味着球场的俯视图不能用每个球员看到的东西来近似。如果你能详细说明这一点来解释为什么每个球员的视图组合不能形成一个粗略的球场俯视图，那么这对于理解这种方法的缺陷将非常有用。另外，我认为最好使用我的数据而不是 MNIST（我已经检查了具有形状上下文的 MNIST 数据集），因为问题可能是特定于数据的。