【问题标题】:Which pre-processing step is good for my dataset?哪个预处理步骤对我的数据集有好处?
【发布时间】:2017-11-03 11:42:57
【问题描述】:

我有一个图像训练数据集。这些图像的范围为 0-2500。但是,在我的测试数据集中,一些图像的范围为 200-3000。我的问题是哪个预处理步骤对这种数据有好处:

  1. 归一化为零均值和单位方差
  2. 归一化为 [0,1]
  3. 通过标准化 [0,1] 转换为 0-2500 范围,然后乘以 2500

谢谢大家

【问题讨论】:

  • 您唯一的选择就是试验一下,看看哪一种效果更好。

标签: image image-processing computer-vision deep-learning


【解决方案1】:

您输入神经网络的数据应该尽可能接近您的测试数据集。这通常通过归一化来完成,因为这些值通常在相似图像中密切相关。但是,这不能笼统地说,并且取决于您的用例。对于一般的经验法则,我建议您查看:http://ufldl.stanford.edu/wiki/index.php/Data_Preprocessing

【讨论】:

  • 谢谢,托马斯·皮内茨。你是完全正确的,我真的同意你的训练和测试范围必须尽可能接近。但是,就我而言,与[0,2000] 相比,测试数据具有不同的范围[200,3000]。您认为选项 2 或 3 更好吗?因为它们是标准化图像的相同方法
  • 我个人将从选项 2 开始。如果测试错误不在应有的位置,我会尝试选项 1 作为替代。
  • 谢谢。一些论文提到选项 1 而不是选项 2。谢谢你的帮助。在斯坦福的过程中,它也使用选项1
  • 这是因为归一化训练集和批量归一化之间的相互作用。批量归一化需要一个 0 均值单位方差的训练集。然而,尽管我大量使用了批量标准化,但我最近通过对我的用例使用 0-1 标准化获得了更好的性能。
  • 感谢您分享这些信息。对,我也在我的网络中使用了 BN 层。我会按照你的建议尝试规范化 0-1
猜你喜欢
  • 1970-01-01
  • 2021-04-28
  • 1970-01-01
  • 2021-07-15
  • 1970-01-01
  • 2020-12-10
  • 1970-01-01
  • 2023-04-04
  • 1970-01-01
相关资源
最近更新 更多