AdditiveGaussianModule¶

class torchrl.modules.tensordict_module.AdditiveGaussianModule(*args, **kwargs)[source]¶

加性高斯 PO 模块。

参数：

关键字参数：

action_key (嵌套键, 可选) – 如果策略模块有多个输出键，则其输出规范将为 CompositeSpec 类型。需要知道在哪里找到动作规范。默认值：“action”

注意

在训练循环中包含对 step() 的调用以更新探索因子至关重要。由于很难捕获此遗漏，因此如果省略此操作，将不会发出警告或引发异常！

forward(tensordict: TensorDictBase) → TensorDictBase[source]¶

定义每次调用时执行的计算。

应由所有子类覆盖。

注意

尽管正向传递的步骤需要在此函数中定义，但应该随后调用 Module 实例，而不是此函数，因为前者会处理运行注册的钩子，而后者会静默地忽略它们。

step(frames: int = 1) → None[source]¶

sigma 衰减的一步。

在对该方法调用 self.annealing_num_steps 次后，后续调用将变为无操作。

文档