UpdateWeights¶
- class torchrl.trainers.UpdateWeights(collector: DataCollectorBase, update_weights_interval: int)[source]¶
一个用于更新收集器权重的钩子类。
当收集器的策略权重所在的设备与 Trainer 正在训练的策略权重所在的设备不同时,必须使用此钩子。在这种情况下,必须定期在设备之间同步这些权重。如果设备相同,则此操作将为空操作。
- 参数:
collector (DataCollectorBase) – 必须同步策略权重的数据收集器。
update_weights_interval (int) – 必须进行同步的间隔(以收集的批次数为单位)。
示例
>>> update_weights = UpdateWeights(trainer.collector, T) >>> trainer.register_op("post_steps", update_weights)