DataCollectorBase¶ class torchrl.collectors.DataCollectorBase[source]¶ 数据收集器的基类。 update_policy_weights_(policy_weights: Optional[TensorDictBase] = None) → None[source]¶ 如果数据收集器的策略和训练后的策略位于不同的设备上,则更新策略权重。 参数: policy_weights (TensorDictBase, optional) – 如果提供,则为包含策略权重的 TensorDict,用于更新。