【发布时间】:2017-11-19 23:22:36
【问题描述】:
制作一些这样的网络
Conv(1-1)-Conv(1-2)-Loss1-Conv(2-1)-Conv(2-2)-Loss2
当我使用 caffe 训练这个网络时,效果如何? Conv(2-1) 和 Conv(2-2) 使用 Loss2 更新。我可以得到它。
但是如何更新 Conv(1-1) 和 Conv(1-2) 中的权重? 只使用 Loss1?或使用来自 Conv(2-1) 的梯度和来自 Loss1 的梯度的总和?
【问题讨论】:
标签: machine-learning neural-network deep-learning caffe gradient-descent