快捷方式

RMSNorm

class torch.nn.modules.normalization.RMSNorm(normalized_shape, eps=None, elementwise_affine=True, device=None, dtype=None)[source][source]

对输入 mini-batch 应用均方根层归一化。

此层实现了论文 Root Mean Square Layer Normalization 中描述的操作

yi=xiRMS(x)γi,whereRMS(x)=ϵ+1ni=1nxi2y_i = \frac{x_i}{\mathrm{RMS}(x)} * \gamma_i, \quad \text{where} \quad \text{RMS}(x) = \sqrt{\epsilon + \frac{1}{n} \sum_{i=1}^{n} x_i^2}

均方根 (RMS) 计算是基于最后 D 个维度进行的,其中 Dnormalized_shape 的维度。例如,如果 normalized_shape(3, 5)(一个二维形状),则均方根计算将应用于输入的最后 2 个维度。

参数
  • normalized_shape (intlisttorch.Size) –

    预期输入大小的输入形状

    [×normalized_shape[0]×normalized_shape[1]××normalized_shape[1]][* \times \text{normalized\_shape}[0] \times \text{normalized\_shape}[1] \times \ldots \times \text{normalized\_shape}[-1]]

    如果使用单个整数,则将其视为单元素列表,此模块将对最后一个维度进行归一化,该维度的预期大小即为此整数值。

  • eps (Optional[float]) – 添加到分母中用于数值稳定性的值。默认值: torch.finfo(x.dtype).eps()

  • elementwise_affine (bool) – 布尔值。当设置为 True 时,此模块具有可学习的逐元素仿射参数,参数(对于权重)初始化为 1。默认值: True

形状
  • 输入: (N,)(N, *)

  • 输出: (N,)(N, *) (与输入形状相同)

示例

>>> rms_norm = nn.RMSNorm([2, 3])
>>> input = torch.randn(2, 2, 3)
>>> rms_norm(input)
extra_repr()[source][source]

模块的额外信息。

返回类型

str

forward(x)[source][source]

运行前向传播。

返回类型

Tensor

reset_parameters()[source][source]

根据在 __init__ 中使用的初始化方法重置参数。

文档

查阅 PyTorch 的全面开发者文档

查看文档

教程

获取适合初学者和高级开发者的深度教程

查看教程

资源

查找开发资源并获得问题解答

查看资源