基本说明

  • 矩阵求导无非就是:一个矩阵里的元素对另一个矩阵里的元素进行对应求导,只要符合一些规则而已;这些规则就是:
    • 分子布局(Numerator layout):即分子为列向量,分母为行向量
    • 分母布局(Denominator layout):即分子为行向量,分母为列向量
  • 分子布局(Numerator layout)
    • 假设:x,y为常数x=[x1,x2,,xn]T\vec{x}=[x_1,x_2,…,x_n ]^Ty=[y1,y2,,ym]T\vec{y}=[y_1,y_2,…,y_m ]^TX=[x11,x12x1nx21,x22x2n,xn1,xn2xnn]X=\begin{bmatrix} x_{11},x_{12} & \cdots & x_{1n} \\ x_{21},x_{22} & \cdots & x_{2n} \\ \vdots ,\vdots & \ddots & \vdots \\ x_{n1},x_{n2} & \cdots & x_{nn} \\ \end{bmatrix}Y=[y11,y12y1ny21,y22y2n,yn1,yn2ynn]Y=\begin{bmatrix} y_{11},y_{12} & \cdots & y_{1n} \\ y_{21},y_{22} & \cdots & y_{2n} \\ \vdots ,\vdots & \ddots & \vdots \\ y_{n1},y_{n2} & \cdots & y_{nn} \\ \end{bmatrix}
  • 向量/标量 :yx=[y1x,y2x,...,ymx]T\frac{∂\vec{y}}{∂x}=[\frac{∂y_1}{∂x},\frac{∂y_2}{∂x},...,\frac{∂y_m}{∂x}]^T
  • 标量/向量:yx=[yx1,yx2,...,yxn]\frac{∂y}{∂\vec{x}}=[\frac{∂y}{∂x_1},\frac{∂y}{∂x_2},...,\frac{∂y}{∂x_n}]
  • 向量/向量:
    【数学】矩阵导数
    这就是著名的雅可比(Jacobian)矩阵
  • 矩阵/标量:
    【数学】矩阵导数
  • 标量/矩阵:
    【数学】矩阵导数
  • 矩阵/向量:
    【数学】矩阵导数
  • 向量/矩阵:(xT)Y=[x1y11,x2y21xnyn1x1y12,x2y22xnyn2,x1y1n,x2y2nxnynn]\frac{∂(\vec{x}^T)}{∂Y}=\begin{bmatrix} \frac{∂x_1}{∂y_{11}},\frac{∂x_2}{∂y_{21}} & \cdots & \frac{∂x_n}{∂y_{n1}} \\\\ \frac{∂x_1}{∂y_{12}},\frac{∂x_2}{∂y_{22}} & \cdots & \frac{∂x_n}{∂y_{n2}} \\\\ \vdots ,\vdots & \ddots & \vdots \\\\ \frac{∂x_1}{∂y_{1n}},\frac{∂x_2}{∂y_{2n}} & \cdots & \frac{∂x_n}{∂y_{nn}} \\ \end{bmatrix}
  • 矩阵/矩阵:YX=[y11x11,y12x21y1nxn1y21x12,y22x22y2nyn2,yn1x1n,yn2x2nynnynn]\frac{∂Y}{∂X}=\begin{bmatrix} \frac{∂y_{11}}{∂x_{11}},\frac{∂y_{12}}{∂x_{21}} & \cdots & \frac{∂y_{1n}}{∂x_{n1}} \\\\ \frac{∂y_{21}}{∂x_{12}},\frac{∂y_{22}}{∂x_{22}} & \cdots & \frac{∂y_{2n}}{∂y_{n2}} \\\\ \vdots ,\vdots & \ddots & \vdots \\\\ \frac{∂y_{n1}}{∂x_{1n}},\frac{∂y_{n2}}{∂x_{2n}} & \cdots & \frac{∂y_{nn}}{∂y_{nn}} \\ \end{bmatrix}
  • 分母布局(Denominator layout)
    • 就是上面所有结果的转置。

运算公式

相关文章: