AdditiveGaussianModule¶
- class torchrl.modules.AdditiveGaussianModule(*args, **kwargs)[source]¶
加性高斯 PO 模块。
- 参数:
spec (TensorSpec) – 用于采样动作的规格。采样到的动作在探索后将被投影到有效动作空间。
sigma_init (scalar, optional) – 初始 sigma 值。默认值: 1.0
sigma_end (scalar, optional) – 最终 sigma 值。默认值: 0.1
annealing_num_steps (int, optional) – sigma 达到
sigma_end
值所需的步数。默认值: 1000mean (
float
, optional) – 每个输出元素正态分布的均值。默认值: 0.0std (
float
, optional) – 每个输出元素正态分布的标准差。默认值: 1.0
- 关键字参数:
action_key (NestedKey, optional) – 如果策略模块有多个输出键,其输出规格将是复合类型 (Composite)。需要知道在哪里找到动作规格 (action spec)。默认值: “action”
safe (bool) – 如果为
True
,超出动作规格范围的动作将根据TensorSpec.project
启发式算法投影到空间中。默认值: Falsedevice (torch.device, optional) – 存储缓冲区的设备。
注意
在训练循环中包含对
step()
的调用来更新探索因子 (exploration factor) 至关重要。由于很难捕捉到这种遗漏,如果省略此调用,将不会引发警告或异常!