如何为神经网络分类选择输入？答案

【问题标题】：How to choose input for neural network classification?如何为神经网络分类选择输入？
【发布时间】：2017-09-25 12:53:24
【问题描述】：

我有一组不同表面对光的吸收随时间变化的数据。这是我的训练数据，我知道每条曲线属于哪个表面(in this training data plot)，但我想设计一个神经网络分类器，它可以给出与我输入的输入相对应的输出。

我从未使用过分类器，所以我不知道如何开始。我想知道如何确定我的数据集中用于分类的特征？是否有一个通用程序，以便我可以决定用于任意数据分类的特征？不仅仅是图像和文本分类，因为大多数教程要么讨论此类问题，要么假设给出了神经网络的输入向量。

【问题讨论】：

您能否向我们提供有关您的数据的更多信息？你的数据是图像吗？还是别的什么？
我在原始帖子中附加了数据，它作为 19 个不同样本的 matlab 图提供。您可以点击链接查看。或者你的意思是数据的来源？正如我所提到的，不同表面对光的吸收随时间变化。对于每个样本，在不同的时间间隔测量吸收率并使用 matlab 绘制。

【解决方案1】：

如果您一开始就觉得这太复杂了，只要您可以访问原始数据，找出您认为数据中不同的一些因素可能就足够了。这些只是一些想法：

例如平均梯度、偏移量、标准差、最小梯度、最大梯度等。请记住，可以用来区分的东西越少越好。

只需通过每个因子运行每行的原始数据点，它们就会成为网络的输入。每个因素一个输入，当然是标准化的。

对于每个表面可以有一个神经元的输出，输出最高的神经元就是你的赢家。

【讨论】：

谢谢！你真的给了我一些启示！所以我真的需要找到可以描述数据特征的因素以进行适当的分类，这些因素决定了我的神经网络的输入数量？而且我知道 PCA，但我不知道它如何帮助我解决问题，因为我的数据只是二维的，而且我已经知道时间是无关紧要的。那么在这种情况下它可以起到什么作用呢？你的意思是
是的。 PCA 仅对减少网络的输入数量非常有用（因为越少越好，不仅是为了性能，而且是泛化等），所以我会在 excel 中为您的数据选择一些统计值，（看看@987654323 @) 看看它们有何不同，选择每个系列之间差异最大的那些，但根据需要选择一些。 PCA 可用于从您选择的功能中找到最有用的功能（但如果您选择了好的功能，则不需要）