快捷方式

DataCollectorBase

class torchrl.collectors.DataCollectorBase[source]

数据收集器的基类。

update_policy_weights_(policy_weights: Optional[TensorDictBase] = None) None[source]

如果数据收集器的策略和训练后的策略位于不同的设备上,则更新策略权重。

参数:

policy_weights (TensorDictBase, optional) – 如果提供,则为包含策略权重的 TensorDict,用于更新。

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取面向初学者和高级开发者的深度教程

查看教程

资源

查找开发资源并获得问题解答

查看资源