【问题标题】:How to choose input for neural network classification?如何为神经网络分类选择输入?
【发布时间】:2017-09-25 12:53:24
【问题描述】:

我有一组不同表面对光的吸收随时间变化的数据。这是我的训练数据,我知道每条曲线属于哪个表面(in this training data plot),但我想设计一个神经网络分类器,它可以给出与我输入的输入相对应的输出。

我从未使用过分类器,所以我不知道如何开始。我想知道如何确定我的数据集中用于分类的特征?是否有一个通用程序,以便我可以决定用于任意数据分类的特征?不仅仅是图像和文本分类,因为大多数教程要么讨论此类问题,要么假设给出了神经网络的输入向量。

【问题讨论】:

  • 您能否向我们提供有关您的数据的更多信息?你的数据是图像吗?还是别的什么?
  • 我在原始帖子中附加了数据,它作为 19 个不同样本的 matlab 图提供。您可以点击链接查看。或者你的意思是数据的来源?正如我所提到的,不同表面对光的吸收随时间变化。对于每个样本,在不同的时间间隔测量吸收率并使用 matlab 绘制。

标签: machine-learning neural-network


【解决方案1】:

没有真正的一刀切的方法。我听说的唯一与您可能正在寻找的内容接近的是主成分分析 (https://en.wikipedia.org/wiki/Principal_component_analysis),但这可能太复杂了。这可能是一个更好的起点 (https://georgemdallas.wordpress.com/2013/10/30/principal-component-analysis-4-dummies-eigenvectors-eigenvalues-and-dimension-reduction/)。

如果您一开始就觉得这太复杂了,只要您可以访问原始数据,找出您认为数据中不同的一些因素可能就足够了。这些只是一些想法:

例如平均梯度、偏移量、标准差、最小梯度、最大梯度等。请记住,可以用来区分的东西越少越好。

只需通过每个因子运行每行的原始数据点,它们就会成为网络的输入。每个因素一个输入,当然是标准化的。

对于每个表面可以有一个神经元的输出,输出最高的神经元就是你的赢家。

【讨论】:

  • 谢谢!你真的给了我一些启示!所以我真的需要找到可以描述数据特征的因素以进行适当的分类,这些因素决定了我的神经网络的输入数量?而且我知道 PCA,但我不知道它如何帮助我解决问题,因为我的数据只是二维的,而且我已经知道时间是无关紧要的。那么在这种情况下它可以起到什么作用呢?你的意思是
  • 是的。 PCA 仅对减少网络的输入数量非常有用(因为越少越好,不仅是为了性能,而且是泛化等),所以我会在 excel 中为您的数据选择一些统计值,(看看@987654323 @) 看看它们有何不同,选择每个系列之间差异最大的那些,但根据需要选择一些。 PCA 可用于从您选择的功能中找到最有用的功能(但如果您选择了好的功能,则不需要)
猜你喜欢
  • 2020-06-25
  • 2012-10-05
  • 1970-01-01
  • 1970-01-01
  • 2019-07-17
  • 2017-06-13
  • 1970-01-01
  • 2010-10-13
相关资源
最近更新 更多