TanhDelta¶
- class torchrl.modules.TanhDelta(param: Tensor, low: Union[Tensor, float] = - 1.0, high: Union[Tensor, float] = 1.0, event_dims: int = 1, atol: float =1e-06, rtol: float =1e-06, safe: bool =True)[源代码]¶
实现一个 Tanh 变换的 Delta 分布。
- 参数:
param (torch.Tensor) – Delta 分布的参数;
low (torch.Tensor 或 数字, 可选) – 分布的最小值。默认值为 -1.0;
high (torch.Tensor 或 数字, 可选) – 分布的最大值。默认值为 1.0;
event_dims (int, 可选) – 描述动作的维度数量。默认值为 1;
atol (数字, 可选) – 认为张量匹配分布参数的绝对容差;默认值为 1e-6
rtol (数字, 可选) – 认为张量匹配分布参数的相对容差;默认值为 1e-6
batch_shape (torch.Size, 可选) – batch 形状;
event_shape (torch.Size, 可选) – 结果的形状;