【发布时间】:2020-02-11 00:23:15
【问题描述】:
在训练卷积自动编码器之前,我对如何标准化/标准化图像像素值有点困惑。目标是使用自动编码器进行降噪,这意味着我的训练图像由噪声图像和用作基本事实的原始非噪声图像组成。
据我所知,有一些选项可以对图像进行预处理: - 标准化 - 标准化(z-score)
当使用 MinMax 方法(在 0-1 之间缩放)进行标准化时,网络工作正常,但我的问题是: - 当使用训练集的最小最大值进行缩放时,我应该使用噪声图像还是地面实况图像的最小/最大值?
我在训练自动编码器时观察到的第二件事: - 使用 z-score 标准化,前两个时期的损失减少,之后它停在大约 0.030 并停留在那里(它卡住了)。这是为什么?归一化后损失会减少很多。
提前致谢,
干杯,
迈克
【问题讨论】:
-
MinMax 对噪声和异常值非常敏感,因此我不会在去噪应用程序中使用它。您可以改用分位数 5% 和 95%,或使用 z 分数。为了更真实的训练,应该对有噪声的图像进行归一化
-
我们没有足够的信息来回答您的第二个问题。什么损失?网络中使用了任何权重正则化?请让它成为一个独立的问题
-
感谢您的评论。是的,z 分数标准化似乎是有道理的。我使用没有任何权重正则化的 MSE 损失。除了最后一个使用 Sigmoid 之外,所有层都使用 relu 激活。干杯,迈克尔
-
Sigmoid 将强制其输出介于 0 和 1 之间,因此它不适合 z 分数转换图像上的自动编码器(因为目标强度可以采用任意正值或负值)。
-
谢谢皮埃尔。你认为在这种情况下线性激活会更好吗?我也在考虑我在隐藏层中使用的 relu 激活。如果使用 z 分数标准化,那么 relu 是一个不错的选择,还是会阻止所有负值?再次感谢,迈克尔
标签: machine-learning deep-learning normalization autoencoder