SoftUpdate¶
- class torchrl.objectives.SoftUpdate(loss_module: Union[DQNLoss, DDPGLoss, SACLoss, REDQLoss, TD3Loss], *, eps: Optional[float] = None, tau: Optional[float] = None)[source]¶
用于 Double DQN/DDPG 中目标网络更新的软更新类。
这在“CONTINUOUS CONTROL WITH DEEP REINFORCEMENT LEARNING” 中提出,https://arxiv.org/pdf/1509.02971.pdf
必须指定一个且只有一个衰减因子(tau 或 eps)。