快捷方式

NormalParamWrapper

class torchrl.modules.NormalParamWrapper(operator: Module, scale_mapping: str = 'biased_softplus_1.0', scale_lb: Number = 0.0001)[source]

正态分布参数的包装器。

参数:
  • operator (nn.Module) – 运算符,其输出将在位置和尺度参数中进行转换

  • scale_mapping (str, optional) – 与标准差一起使用的正向映射函数。默认值 = “biased_softplus_1.0”(即 softplus 映射,具有偏置,使得 fn(0.0) = 1.0)选项:“softplus”、“exp”、“relu”、“biased_softplus_1”;

  • scale_lb (Number, optional) – 方差可以采用的最小值。默认值为 1e-4。

示例

>>> from torch import nn
>>> import torch
>>> module = nn.Linear(3, 4)
>>> module_normal = NormalParamWrapper(module)
>>> tensor = torch.randn(3)
>>> loc, scale = module_normal(tensor)
>>> print(loc.shape, scale.shape)
torch.Size([2]) torch.Size([2])
>>> assert (scale > 0).all()
>>> # with modules that return more than one tensor
>>> module = nn.LSTM(3, 4)
>>> module_normal = NormalParamWrapper(module)
>>> tensor = torch.randn(4, 2, 3)
>>> loc, scale, others = module_normal(tensor)
>>> print(loc.shape, scale.shape)
torch.Size([4, 2, 2]) torch.Size([4, 2, 2])
>>> assert (scale > 0).all()
forward(*tensors: Tensor) Tuple[Tensor][source]

定义每次调用时执行的计算。

应由所有子类重写。

注意

尽管正向传递的配方需要在该函数内定义,但之后应调用 Module 实例而不是此函数,因为前者负责运行注册的钩子,而后者则会静默地忽略它们。

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取面向初学者和高级开发者的深度教程

查看教程

资源

查找开发资源并获得问题解答

查看资源