【发布时间】:2016-04-24 19:53:27
【问题描述】:
我注意到 H2O packages mentions that it:
预处理要标准化的数据以兼容 激活函数(回忆表 1 对每个激活函数的总结 函数的目标空间)。由于激活函数不 通常映射到实数的全谱 R,我们首先 标准化我们的数据以从 N (0, 1) 中提取。再次标准化 在网络传播之后,我们可以计算更精确的误差 这个标准化空间,而不是原始特征空间。为了 自动编码,数据被标准化(而不是标准化)到 mathcalU(−0.5, 0.5) 的紧凑区间,以允许有界激活 像 Tanh 这样的函数来更好地重建数据。
但是,我并不完全理解。我的印象是(here 和 here)分类变量应该被分解为 1-of-C 虚拟变量和连续数据标准化。 那么,一切都应该标准化为 [-1,1]。
我也看不到为读出层指定神经元的方法。我认为如果我们有一个 categorical 输出变量,那么我们想要使用 softmax 激活函数(并编码为 1-of-C)/如果我们有一个 continuous 输出(例如价格)然后我们将其缩放到 [-1,1] 并使用 'tanh' / 如果我们有 single binary 输出,那么我们可以使用逻辑并将其编码为 [0,1]
【问题讨论】:
标签: r machine-learning neural-network deep-learning h2o