【问题标题】:Neural Network Architecture for unordered data无序数据的神经网络架构
【发布时间】:2021-06-05 16:56:20
【问题描述】:

假设您有 500 个类别的 10 个特征。每个输入一个类别只能出现一次。这些特征可以是任何特定的顺序。例如 [1,2,3,4,5,...], [5,3,4,2,1,...] 等。顺序无关紧要 [1,2,3, 4,5,...] = [5,3,4,2,1,...]。因此,您可以打乱您的训练数据以在无序数据上训练网络。

现在您想将其馈送到您的神经网络。我想到了 3 种架构:

  1. MLP(输入:embedding_dim x n_features)
  2. 带有嵌入的 LSTM(输入:embedding_dim,序列长度:n_features)
  3. 具有一种热编码的 LSTM(输入:feature_dim,序列长度:n_features)

在您的循证研究中,哪一个在无序数据上表现更好?

您是否有其他在无序数据上表现良好的架构。 (也许甚至不需要改组训练数据)

【问题讨论】:

  • 它也缺乏细节,基于意见,并要求推荐,所有这些都是reasons for closure
  • 我不明白这是如何基于意见的。也许某些 nn 模型在学习高维无序数据方面具有优势,例如卷积网络在图像上表现良好。也许你甚至可以测量它....

标签: machine-learning neural-network recurrent-neural-network


【解决方案1】:

您实际上想建模什么?这些信息可能会为解决问题提供一些线索。

如果我理解正确,您正在尝试从大小为 10 的无序多重集中学习。每个元素可能假设为 500 个类别之一。

对您的数据进行一些预处理可能会有所帮助。我想到的两种方法是:

  1. 每个样本都可以编码为大小为 500 的向量,其中每个分量表示相应元素的多重性,例如[1,1,1,1,3,3,3,4,4,5] 将表示为 [4,0,3,2,1,0,...]。
  2. 另一种简单的方法是重新订购样品。否则,不同输入的数量会非常多,即 500^10。

【讨论】:

  • 抱歉不够具体。这些功能只是二进制的。嵌入应该补偿高特征维度。在 lstm 的情况下,甚至可能不需要嵌入。
  • 对不起,我不明白你打算做什么。我认为您需要提供更多背景信息。
猜你喜欢
  • 2013-11-29
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2020-08-14
  • 2017-10-21
  • 1970-01-01
相关资源
最近更新 更多