综述
微分是函数,其自变量是原函数自变量发生的微小变化,其值是函数值随其发生的变化量。
梯度是向量,其第i个分量是函数值对自变量的第i个分量的偏分,故梯度只在$f: R^n\rightarrow R$上有定义。
偏分是梯度的分量,也是函数。
Jacobian矩阵定义在所有函数上,对$f:R^n\rightarrow R^m$,有:
一般而言,$n_1$维张量对$n_2$维张量的Jacobian矩阵有$n_1+n_2$维。
对$f: R^n\rightarrow R$而言,Jacobian矩阵退化为一个向量,梯度是它的转置。
链式法则是作用在Jacobian矩阵上的。
向量对向量
Jacobian矩阵在链式法则中的应用
若有函数$\overrightarrow{f}(x)$和函数$\overrightarrow{g}(\overrightarrow{f})$,那么
实例
设$\overrightarrow{x}$为维度a的向量,$W$为$b\times a$的矩阵
向量对矩阵
实例
设$\overrightarrow{x}$为维度a的向量,$W$为$b\times a$的矩阵
矩阵对矩阵
实例
设$X$为维度$a\times b$的向量,$W$为$b\times c$的矩阵
