HardUpdate¶

类 torchrl.objectives.HardUpdate(loss_module: Union['DQNLoss', 'DDPGLoss', 'SACLoss', 'TD3Loss'], *, value_network_update_interval: float = 1000)[源码]¶

一个硬更新类，用于 Double DQN/DDPG 中的目标网络更新（与软更新相对）。

这在原始的 Double DQN 论文中提出：“Deep Reinforcement Learning with Double Q-learning”，https://arxiv.org/abs/1509.06461。