【发布时间】:2020-11-15 15:30:53
【问题描述】:
我正在尝试自己实现一些 AD 算法,但我不太了解 Gower 和 Mello 的 edge pushing algorithm 用于计算稀疏 Hessian 矩阵。
是否需要生成“原始梯度”的新计算图(例如在计算 (x^2) 时是否应生成图 (2*x) 以求二阶导数 (2)),因为论文指出,虚线弧代表“非线性相互作用”,伴随物究竟是如何累积形成二阶导数的?
另外,如果需要一个新图,这与符号微分有何不同?谢谢!
【问题讨论】:
标签: tensorflow math optimization mathematical-optimization automatic-differentiation