torch.func.jacfwd¶

torch.func.jacfwd(func, argnums=0, has_aux=False, *, randomness='error')[source]¶

使用前向模式自动微分计算 func 关于索引为 argnum 的参数的雅可比矩阵

参数

func (function) – 一个 Python 函数，接受一个或多个参数（其中一个必须是 Tensor），并返回一个或多个 Tensor
argnums (int 或 Tuple[int]) – 可选，整数或整数元组，指定对哪些参数计算雅可比矩阵。默认值：0。
has_aux (bool) – 标志，指示 func 返回一个 (output, aux) 元组，其中第一个元素是要进行微分的函数的输出，第二个元素是不会进行微分的辅助对象。默认值：False。
randomness (str) – 标志，指示使用何种类型的随机性。更多细节请参阅 vmap()。允许值：“different”、“same”、“error”。默认值：“error”

返回

返回一个函数，该函数接受与 func 相同的输入，并返回 func 关于索引为 argnums 的参数的雅可比矩阵。如果 has_aux is True，则返回的函数将返回一个 (jacobian, aux) 元组，其中 jacobian 是雅可比矩阵，aux 是由 func 返回的辅助对象。

注意

您可能会遇到此 API 报错，提示“算子 X 未实现前向模式 AD”。如果遇到这种情况，请提交错误报告，我们会优先处理。另一种选择是使用 jacrev()，它具有更好的算子覆盖范围。

对于逐点的一元运算，其基本用法将得到一个对角数组作为雅可比矩阵

>>> from torch.func import jacfwd
>>> x = torch.randn(5)
>>> jacobian = jacfwd(torch.sin)(x)
>>> expected = torch.diag(torch.cos(x))
>>> assert torch.allclose(jacobian, expected)

jacfwd() 可以与 vmap 组合以生成批处理雅可比矩阵

>>> from torch.func import jacfwd, vmap
>>> x = torch.randn(64, 5)
>>> jacobian = vmap(jacfwd(torch.sin))(x)
>>> assert jacobian.shape == (64, 5, 5)

如果您想计算函数的输出以及函数的雅可比矩阵，请使用 has_aux 标志将输出作为辅助对象返回

>>> from torch.func import jacfwd
>>> x = torch.randn(5)
>>>
>>> def f(x):
>>>   return x.sin()
>>>
>>> def g(x):
>>>   result = f(x)
>>>   return result, result
>>>
>>> jacobian_f, f_x = jacfwd(g, has_aux=True)(x)
>>> assert torch.allclose(f_x, f(x))

此外，jacrev() 可以与自身或 jacrev() 组合以生成 Hessian 矩阵

>>> from torch.func import jacfwd, jacrev
>>> def f(x):
>>>   return x.sin().sum()
>>>
>>> x = torch.randn(5)
>>> hessian = jacfwd(jacrev(f))(x)
>>> assert torch.allclose(hessian, torch.diag(-x.sin()))

默认情况下，jacfwd() 计算关于第一个输入的雅可比矩阵。然而，通过使用 argnums，它可以计算关于不同参数的雅可比矩阵

>>> from torch.func import jacfwd
>>> def f(x, y):
>>>   return x + y ** 2
>>>
>>> x, y = torch.randn(5), torch.randn(5)
>>> jacobian = jacfwd(f, argnums=1)(x, y)
>>> expected = torch.diag(2 * y)
>>> assert torch.allclose(jacobian, expected)

此外，向 argnums 传入一个元组将计算关于多个参数的雅可比矩阵

>>> from torch.func import jacfwd
>>> def f(x, y):
>>>   return x + y ** 2
>>>
>>> x, y = torch.randn(5), torch.randn(5)
>>> jacobian = jacfwd(f, argnums=(0, 1))(x, y)
>>> expectedX = torch.diag(torch.ones_like(x))
>>> expectedY = torch.diag(2 * y)
>>> assert torch.allclose(jacobian[0], expectedX)
>>> assert torch.allclose(jacobian[1], expectedY)

torch.func.jacfwd¶

文档

教程

资源