快捷方式

ConstantKLController

class torchrl.data.ConstantKLController(*, kl_coef: Optional[float] = None, model: Optional[Module] = None)[source]

恒定 KL 控制器。

此控制器保持固定的系数,无论使用什么值进行更新。

关键字参数:
  • kl_coef (float) – 在计算奖励时与 KL 相乘的系数。

  • model (nn.Module, 可选) – 需要控制的包装模型。必须具有属性 "kl_coef"。如果提供,"kl_coef" 将被就地更新。

文档

访问 PyTorch 的综合开发者文档

查看文档

教程

获取面向初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获得问题解答

查看资源