快捷方式

IndependentNormal

class torchrl.modules.IndependentNormal(loc: Tensor, scale: Tensor, upscale: float = 5.0, tanh_loc: bool = False, event_dim: int = 1, **kwargs)[source]

实现具有位置缩放的 Normal 分布。

位置缩放防止位置“离 0 太远”,这最终会导致数值不稳定的样本和较差的梯度计算(例如,梯度爆炸)。实际上,位置是根据以下公式计算的

\[loc = tanh(loc / upscale) * upscale.\]

可以通过关闭 tanh_loc 参数来禁用此行为(见下文)。

参数:
  • loc (torch.Tensor) – normal 分布位置参数

  • scale (torch.Tensor) – normal 分布 sigma 参数(方差的平方根)

  • upscale (torch.Tensornumber, optional) –

    公式中的 ‘a’ 缩放因子

    \[loc = tanh(loc / upscale) * upscale.\]

    默认为 5.0

  • tanh_loc (bool, optional) – 如果 False,则上述公式用于位置缩放,否则保留原始值。默认为 False

property mode

返回分布的众数。

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取面向初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获得问题解答

查看资源