作者:李飞腾链接:https://zhuanlan.zhihu.com/p/22473137
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
如果能二秒内在脑袋里解出下面的问题,本文便结束了。
已知:,其中
。
求:,
,
。
“求导的链式法则” :
设和
为
的可导函数,则
。
一个原则维数相容,实质是多元微分基本知识,没有在课本中找到下列内容,维数相容原则是我个人总结:
维数相容原则:通过前后换序、转置 使求导结果满足矩阵乘法且结果维数满足下式:
如果,
,那么
。
利用维数相容原则解上例:
step1:把所有参数当做实数来求导,,
依据链式法则有,
,
可以看出除了,
和
的求导结果在维数上连矩阵乘法都不能满足。
step2:根据step1的求导结果,依据维数相容原则做调整:前后换序、转置
依据维数相容原则,但
中
、
,自然得调整为
;
同理:,但
中
、
,那么通过换序、转置我们可以得到维数相容的结果
。
对于矩阵、向量求导:
- “当做一维实数使用链式法则求导,然后做维数相容调整,使之符合矩阵乘法原则且维数相容”是快速准确的策略;
- “对单个元素求导、再整理成矩阵形式”这种方式整理是困难的、过程是缓慢的,结果是易出错的(不信你试试)。
如何证明经过维数相容原则调整后的结果是正确的呢?直觉!简单就是美...