【问题标题】:Can 1D CNNs infer a feature from two other included features?一维 CNN 可以从其他两个包含的特征中推断出一个特征吗?
【发布时间】:2018-04-27 17:37:40
【问题描述】:

我正在对时间数据使用一维 CNN。假设我有两个特征 A 和 B。A 和 B 之间的比率(即 A/B)很重要 - 我们称之为特征 C。我想知道是否需要显式计算并包含特征 C,或者可以CNN 理论上从给定的特征 A 和 B 中推断出特征 C?

我了解在深度学习中,最好排除高度相关的特征(例如特征 C),但我不明白为什么。

【问题讨论】:

    标签: deep-learning convolution feature-extraction feature-selection convolutional-neural-network


    【解决方案1】:

    简短的回答是否定的。使用标准 DNN 层不会自动捕获这种A/B 关系,因为像Conv/Dense 这样的标准层只会执行矩阵乘法运算。

    为了简化讨论,让我们假设您的输入特征是二维的,其中第一个维度是A,第二个维度是B。将Conv 层应用于此特征只需学习权重矩阵w 和偏差b

    y = w * [f_A, f_B] + b = w_A * f_A + w_B * f_B + b

    如您所见,这种表示无法模拟甚至近似AB 之间的比率运算。

    您不必像使用功能AB 一样使用功能C。相反,将特征C 保留为单独的输入可能是一个更好的主意,因为它的动态范围可能与AB 的动态范围非常不同。这意味着您可以拥有一个多输入网络,其中每个输入都有自己的特征提取层,并且可以将两个输入的结果特征连接在一起以预测您的目标。

    【讨论】:

    • 关于多输入网络非常有趣的一点。对于如何将功能组合在一起以创建不同的输入,您有什么建议吗?在我的数据中,我有数千个特征,我们可以将其归类为 1) 原始数据,2) 根据原始数据计算的数据(例如比率),3) 数据的百分比变化
    • 您所说的属于特征工程的范畴。因此,您无法提前知道哪一个效果最好,但您可以尝试所有这些并根据需要制作一个集成模型。
    猜你喜欢
    • 1970-01-01
    • 2022-04-26
    • 1970-01-01
    • 2015-05-29
    • 1970-01-01
    • 1970-01-01
    • 2019-01-20
    • 1970-01-01
    • 2017-06-17
    相关资源
    最近更新 更多