HardUpdate¶
- class torchrl.objectives.HardUpdate(loss_module: Union['DQNLoss', 'DDPGLoss', 'SACLoss', 'TD3Loss'], *, value_network_update_interval: float = 1000)[来源]¶
Double DQN/DDPG 中目标网络更新的硬更新类(与软更新相对)。
这在最初的 Double DQN 论文中提出:“Deep Reinforcement Learning with Double Q-learning”,https://arxiv.org/abs/1509.06461。