【发布时间】:2015-02-28 10:27:32
【问题描述】:
我构建并训练了一个无监督的深度人工神经网络来检测大型数据集中的高阶特征。
数据包含每日天气测量结果,我的深度网络最后一层的输出是 4 个神经元宽,希望代表高阶特征。
现在我想检测一个非常罕见的事件(例如龙卷风)的概率。
我挑出了导致龙卷风的数据点,但它们很少,大约10,000 out of 5,000,000 个数据点。
What's the best design for my tornado classifier?
- 创建一个仅由 10,000 个
tornado数据点组成的训练集,每次输出为 1? - 创建一个由所有 5,000,000 个数据点组成的训练集,当没有龙卷风时输出 0,当有龙卷风时输出 1?但这可能永远无法预测龙卷风。
- 其他解决方案?
【问题讨论】:
-
a training set made of all 5,000,000 data points, with desired output 0 when there is no tornado, and 1 when there is one? [...] will likely never predict a tornado我既不是天气专家,也不是神经网络专家,尽管我涉足后者。我很好奇你为什么不把这种方法视为可能的成功之路。 -
最初的经验测试似乎表明,大量的负数只是训练网络忽略正数。
标签: artificial-intelligence neural-network unsupervised-learning deep-learning