TanhDelta¶
- class torchrl.modules.TanhDelta(param: Tensor, low: Union[Tensor, float] = - 1.0, high: Union[Tensor, float] = 1.0, event_dims: int = 1, atol: float = 1e-06, rtol: float = 1e-06, **kwargs)[source]¶
实现 Tanh 变换的 Delta 分布。
- 参数:
param (torch.Tensor) – Delta 分布的参数;
low (torch.Tensor 或 数字, 可选) – 分布的最小值。默认为 -1.0;
high (torch.Tensor 或 数字, 可选) – 分布的最大值。默认为 1.0;
event_dims (int, 可选) – 描述动作的维度数。默认为 1;
atol (数字, 可选) – 绝对容差,用于认为张量与分布参数匹配;默认为 1e-6
rtol (数字, 可选) – 相对容差,用于认为张量与分布参数匹配;默认为 1e-6
batch_shape (torch.Size, 可选) – 批次形状;
event_shape (torch.Size, 可选) – 结果的形状;