快捷方式

HardUpdate

class torchrl.objectives.HardUpdate(loss_module: Union['DQNLoss', 'DDPGLoss', 'SACLoss', 'TD3Loss'], *, value_network_update_interval: float = 1000)[来源]

Double DQN/DDPG 中目标网络更新的硬更新类(与软更新相对)。

这在最初的 Double DQN 论文中提出:“Deep Reinforcement Learning with Double Q-learning”,https://arxiv.org/abs/1509.06461

参数:

loss_module (DQNLossDDPGLoss) – 目标网络应更新的损失模块。

关键字参数:

value_network_update_interval (标量) – 目标网络应更新的频率。默认值:1000

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

获取面向初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获得解答

查看资源