目录

快捷方式

make_collector_offpolicy¶

torchrl.trainers.helpers.make_collector_offpolicy(make_env: Callable[[], EnvBase], actor_model_explore: Union[TensorDictModuleWrapper, ProbabilisticTensorDictSequential], cfg: DictConfig, make_env_kwargs: Optional[Dict] = None) → DataCollectorBase[源代码]¶

为非策略 (off-policy) sota-实现返回数据收集器。

参数:

make_env (Callable) – 环境创建器
actor_model_explore (SafeModule) – 用于评估和探索更新的模型实例
cfg (DictConfig) – 用于创建收集器对象的配置
make_env_kwargs (dict) – 环境创建器的 kwargs 参数

文档

查阅 PyTorch 的综合开发者文档

查看文档

教程

获取针对初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获得问题解答

查看资源