torch.nn.utils.weight_norm¶

torch.nn.utils.weight_norm(module, name='weight', dim=0)[源代码][源代码]¶

将权重归一化应用于给定模块中的参数。

\mathbf{w} = g \dfrac{\mathbf{v}}{\|\mathbf{v}\|}

权重归一化是一种重参数化技术，它将权重张量的幅度和方向解耦。它将由 name 指定的参数（例如 'weight'）替换为两个参数：一个指定幅度（例如 'weight_g'），另一个指定方向（例如 'weight_v'）。权重归一化通过一个钩子实现，该钩子在每次调用 forward() 之前根据幅度和方向重新计算权重张量。

默认情况下，当 dim=0 时，范数会独立地按每个输出通道/平面计算。要计算整个权重张量的范数，请使用 dim=None。

参见 https://arxiv.org/abs/1602.07868

警告

此函数已废弃。请使用 torch.nn.utils.parametrizations.weight_norm()，它使用现代的 parametrization API。新的 weight_norm 与旧版 weight_norm 生成的 state_dict 兼容。

迁移指南

幅度 (weight_g) 和方向 (weight_v) 现在分别表示为 parametrizations.weight.original0 和 parametrizations.weight.original1。如果您对此感到困扰，请在 https://github.com/pytorch/pytorch/issues/102999 评论。
要移除权重归一化的重参数化，请使用 torch.nn.utils.parametrize.remove_parametrizations()。
权重不再在模块前向传播时一次性重新计算；相反，它会在每次访问时重新计算。要恢复旧的行为，请在调用相关模块之前使用 torch.nn.utils.parametrize.cached()。

参数

module (Module) – 包含模块
name (str, 可选) – 权重参数的名称
dim (int, 可选) – 计算范数的维度

返回

应用了权重归一化钩子的原始模块

返回类型

T_module

示例

>>> m = weight_norm(nn.Linear(20, 40), name='weight')
>>> m
Linear(in_features=20, out_features=40, bias=True)
>>> m.weight_g.size()
torch.Size([40, 1])
>>> m.weight_v.size()
torch.Size([40, 20])

torch.nn.utils.weight_norm¶

文档

教程

资源