快捷方式

make_collector_offpolicy

torchrl.trainers.helpers.make_collector_offpolicy(make_env: Callable[[], EnvBase], actor_model_explore: Union[TensorDictModuleWrapper, ProbabilisticTensorDictSequential], cfg: DictConfig, make_env_kwargs: Optional[Dict] = None) DataCollectorBase[源代码]

返回用于离策略 sota 实现的数据收集器。

参数:
  • make_env (Callable) – 环境创建器

  • actor_model_explore (SafeModule) – 用于评估和探索更新的模型实例

  • cfg (DictConfig) – 用于创建收集器对象的配置

  • make_env_kwargs (dict) – 用于环境创建器的关键字参数

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取面向初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获得问题的解答

查看资源