在贝叶斯框架中,一个完成训练的神经网络是通过其权重的后验概率来表达的。当给网络一个输入数据时,权重分布产生网络输出的分布。同时,对输为的所做的高斯噪声假定也会影响网络输出的分布。这里,通过前面介绍的单高斯近似来计算输出的分布。

 

输出的分布为

NNPR-Chap10 贝叶斯技术(2)模型输出的分布 ,p(w|D)是权重的后验概率分布,p(t|x,w)是在给定权重时目标数据的噪声的概率分布

要计算上面的分布,需要利用两个东东:

1)权重后验概率分布:前面介绍过通过利用高斯分布来近似此分布

2)网络输出的分布:前面介绍过将其假设为零均值加性高斯噪声模型NNPR-Chap10 贝叶斯技术(2)模型输出的分布

从而得到输出的分布为:

                                NNPR-Chap10 贝叶斯技术(2)模型输出的分布           (1)

进一步假设此后验概率分布足够窄(由矩阵A决定),这样就可以通过在NNPR-Chap10 贝叶斯技术(2)模型输出的分布 进行线性扩展来近似NNPR-Chap10 贝叶斯技术(2)模型输出的分布,得到:

                                NNPR-Chap10 贝叶斯技术(2)模型输出的分布NNPR-Chap10 贝叶斯技术(2)模型输出的分布            (2)

这样,就可将式(1)写成

                               NNPR-Chap10 贝叶斯技术(2)模型输出的分布NNPR-Chap10 贝叶斯技术(2)模型输出的分布    (3)

上式积分的结果恰恰是高斯分布:

                                 NNPR-Chap10 贝叶斯技术(2)模型输出的分布              (4)

从而得到输出的均值为NNPR-Chap10 贝叶斯技术(2)模型输出的分布 ,方差为NNPR-Chap10 贝叶斯技术(2)模型输出的分布 (5):

 

通过对式(4)的分析,可以洞察到以下东西:

1)对于t的预测分布的标准差NNPR-Chap10 贝叶斯技术(2)模型输出的分布可看作平均值NNPR-Chap10 贝叶斯技术(2)模型输出的分布的误差条(an error bar)

2)有两个东西对误差条有贡献:

      a)目标数据的内部噪声NNPR-Chap10 贝叶斯技术(2)模型输出的分布,对应于第一项NNPR-Chap10 贝叶斯技术(2)模型输出的分布 。当噪声很大时,NNPR-Chap10 贝叶斯技术(2)模型输出的分布 小,噪声项起绝对作用,如下面左图所示

      b)网络权重后验概率分布NNPR-Chap10 贝叶斯技术(2)模型输出的分布的宽度,对应于第二项。当噪声小时,此后验的方差起绝对作用。

NNPR-Chap10 贝叶斯技术(2)模型输出的分布 图1                               NNPR-Chap10 贝叶斯技术(2)模型输出的分布 图2

 

 

到此,越发佩服贝叶斯技术了吧,它不仅给出一个最佳的预测输出,同时给出输出的误差条。实践中,可以利用两步来计算此误差条:

1)通过最小化正则化的误差函数S(W)求出NNPR-Chap10 贝叶斯技术(2)模型输出的分布

2)计算赫森阵A,带入式(5),得到误差条

 

1.贝叶斯回归案例

考虑一个单输入-单输出的例子:

1)30个数据点,生成自NNPR-Chap10 贝叶斯技术(2)模型输出的分布 ,附带标准差为0.05的高斯加性噪声

2)x抽样自a Gaussian mixture distribution having two wellseparated components

3)采用多参感知器,隐藏4个神经元,激励函数为tanh

4)权重先验为NNPR-Chap10 贝叶斯技术(2)模型输出的分布 ,参数NNPR-Chap10 贝叶斯技术(2)模型输出的分布NNPR-Chap10 贝叶斯技术(2)模型输出的分布 来自an on-line re-estimation procedure

利用前面介绍的误差条计算方法可以生成如下图形,其中实线为权重NNPR-Chap10 贝叶斯技术(2)模型输出的分布对应网络的输出,虚线为NNPR-Chap10 贝叶斯技术(2)模型输出的分布 (利用式5计算)误差。

注意:输入空间中数据密度低的地方,误差条较宽

                 NNPR-Chap10 贝叶斯技术(2)模型输出的分布 图3

2.广义线性网络

对于单层网络,当输出单元是线性时,网络映射是权重的线性函数。这样的模型可表达为 NNPR-Chap10 贝叶斯技术(2)模型输出的分布

 

当输出采用高斯噪声模型,权重采用高斯先验时,总误差函数为NNPR-Chap10 贝叶斯技术(2)模型输出的分布

 

网络输出为(未近似)NNPR-Chap10 贝叶斯技术(2)模型输出的分布

 

赫森矩阵通过外积表示为NNPR-Chap10 贝叶斯技术(2)模型输出的分布

 

网络输出分布的表达高斯积分形式NNPR-Chap10 贝叶斯技术(2)模型输出的分布

相关文章:

  • 2021-12-11
  • 2022-01-18
  • 2022-12-23
  • 2021-09-06
  • 2021-10-30
  • 2021-09-06
  • 2021-09-15
  • 2021-11-10
猜你喜欢
  • 2021-11-19
  • 2021-10-16
  • 2021-08-13
  • 2021-09-06
  • 2021-09-28
  • 2021-07-08
相关资源
相似解决方案