一维 CNN 可以从其他两个包含的特征中推断出一个特征吗？答案

【问题标题】：Can 1D CNNs infer a feature from two other included features?一维 CNN 可以从其他两个包含的特征中推断出一个特征吗？
【发布时间】：2018-04-27 17:37:40
【问题描述】：

我正在对时间数据使用一维 CNN。假设我有两个特征 A 和 B。A 和 B 之间的比率（即 A/B）很重要 - 我们称之为特征 C。我想知道是否需要显式计算并包含特征 C，或者可以CNN 理论上从给定的特征 A 和 B 中推断出特征 C？

我了解在深度学习中，最好排除高度相关的特征（例如特征 C），但我不明白为什么。

【问题讨论】：

【解决方案1】：

简短的回答是否定的。使用标准 DNN 层不会自动捕获这种A/B 关系，因为像Conv/Dense 这样的标准层只会执行矩阵乘法运算。

为了简化讨论，让我们假设您的输入特征是二维的，其中第一个维度是A，第二个维度是B。将Conv 层应用于此特征只需学习权重矩阵w 和偏差b

y = w * [f_A, f_B] + b = w_A * f_A + w_B * f_B + b

如您所见，这种表示无法模拟甚至近似A 和B 之间的比率运算。

您不必像使用功能A 和B 一样使用功能C。相反，将特征C 保留为单独的输入可能是一个更好的主意，因为它的动态范围可能与A 和B 的动态范围非常不同。这意味着您可以拥有一个多输入网络，其中每个输入都有自己的特征提取层，并且可以将两个输入的结果特征连接在一起以预测您的目标。

【讨论】：

关于多输入网络非常有趣的一点。对于如何将功能组合在一起以创建不同的输入，您有什么建议吗？在我的数据中，我有数千个特征，我们可以将其归类为 1) 原始数据，2) 根据原始数据计算的数据（例如比率），3) 数据的百分比变化
您所说的属于特征工程的范畴。因此，您无法提前知道哪一个效果最好，但您可以尝试所有这些并根据需要制作一个集成模型。