DataCollectorBase
-
class torchrl.collectors.DataCollectorBase[source]
数据收集器的基类。
-
update_policy_weights_(policy_weights: Optional[TensorDictBase] = None) → None[source]
如果数据收集器的策略和训练后的策略位于不同的设备上,则更新策略权重。
- 参数:
policy_weights (TensorDictBase, optional) – 如果提供,则是一个 TensorDict,包含用于更新的策略权重。