哪个预处理步骤对我的数据集有好处？答案

【问题标题】：Which pre-processing step is good for my dataset?哪个预处理步骤对我的数据集有好处？
【发布时间】：2017-11-03 11:42:57
【问题描述】：

我有一个图像训练数据集。这些图像的范围为 0-2500。但是，在我的测试数据集中，一些图像的范围为 200-3000。我的问题是哪个预处理步骤对这种数据有好处：

归一化为零均值和单位方差
归一化为 [0,1]
通过标准化 [0,1] 转换为 0-2500 范围，然后乘以 2500

谢谢大家

【问题讨论】：

您唯一的选择就是试验一下，看看哪一种效果更好。

标签： image image-processing computer-vision deep-learning

【解决方案1】：

您输入神经网络的数据应该尽可能接近您的测试数据集。这通常通过归一化来完成，因为这些值通常在相似图像中密切相关。但是，这不能笼统地说，并且取决于您的用例。对于一般的经验法则，我建议您查看：http://ufldl.stanford.edu/wiki/index.php/Data_Preprocessing

【讨论】：

谢谢，托马斯·皮内茨。你是完全正确的，我真的同意你的训练和测试范围必须尽可能接近。但是，就我而言，与[0,2000] 相比，测试数据具有不同的范围[200,3000]。您认为选项 2 或 3 更好吗？因为它们是标准化图像的相同方法
我个人将从选项 2 开始。如果测试错误不在应有的位置，我会尝试选项 1 作为替代。
谢谢。一些论文提到选项 1 而不是选项 2。谢谢你的帮助。在斯坦福的过程中，它也使用选项1
这是因为归一化训练集和批量归一化之间的相互作用。批量归一化需要一个 0 均值单位方差的训练集。然而，尽管我大量使用了批量标准化，但我最近通过对我的用例使用 0-1 标准化获得了更好的性能。
感谢您分享这些信息。对，我也在我的网络中使用了 BN 层。我会按照你的建议尝试规范化 0-1