快捷方式

SoftUpdate

class torchrl.objectives.SoftUpdate(loss_module: Union[DQNLoss, DDPGLoss, SACLoss, REDQLoss, TD3Loss], *, eps: Optional[float] = None, tau: Optional[float] = None)[source]

用于 Double DQN/DDPG 中目标网络更新的软更新类。

这在“CONTINUOUS CONTROL WITH DEEP REINFORCEMENT LEARNING” 中提出,https://arxiv.org/pdf/1509.02971.pdf

必须指定一个且只有一个衰减因子(tau 或 eps)。

参数:
  • loss_module (DQNLossDDPGLoss) – 应更新目标网络的损失模块。

  • eps (标量) –

    更新方程中的 epsilon:.. math

    \theta_t = \theta_{t-1} * \epsilon + \theta_t * (1-\epsilon)
    

    tau 互斥。

  • tau (标量) – Polyak tau。它等于 1-eps,并且与它互斥。

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获得针对初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并获得问题解答

查看资源