make_collector_offpolicy¶
- torchrl.trainers.helpers.make_collector_offpolicy(make_env: Callable[[], EnvBase], actor_model_explore: Union[TensorDictModuleWrapper, ProbabilisticTensorDictSequential], cfg: DictConfig, make_env_kwargs: Optional[Dict] = None) DataCollectorBase [源代码]¶
返回用于离策略 sota 实现的数据收集器。
- 参数:
make_env (Callable) – 环境创建器
actor_model_explore (SafeModule) – 用于评估和探索更新的模型实例
cfg (DictConfig) – 用于创建收集器对象的配置
make_env_kwargs (dict) – 用于环境创建器的关键字参数