SoftUpdate¶
- class torchrl.objectives.SoftUpdate(loss_module: Union['DQNLoss', 'DDPGLoss', 'SACLoss', 'REDQLoss', 'TD3Loss'], *, eps: float = None, tau: Optional[float] = None)[source]¶
用于 Double DQN/DDPG 中目标网络软更新的类。
这在论文“CONTINUOUS CONTROL WITH DEEP REINFORCEMENT LEARNING”中提出,https://arxiv.org/pdf/1509.02971.pdf
必须指定且仅指定一个衰减因子(tau 或 eps)。