快捷方式

transformed_env_constructor

torchrl.trainers.helpers.transformed_env_constructor(cfg: DictConfig, video_tag: str = '', logger: Optional[Logger] = None, stats: Optional[dict] = None, norm_obs_only: bool = False, use_env_creator: bool = False, custom_env_maker: Optional[Callable] = None, custom_env: Optional[EnvBase] = None, return_transformed_envs: bool = True, action_dim_gsde: Optional[int] = None, state_dim_gsde: Optional[int] = None, batch_dims: Optional[int] = 0, obs_norm_state_dict: Optional[dict] = None) Union[Callable, EnvCreator][源代码]

从使用适当的解析器构造函数构建的 argparse.Namespace 返回一个环境创建器。

参数:
  • cfg (DictConfig) – 包含脚本参数的 DictConfig。

  • video_tag (str, 可选) – 要传递给 Logger 对象的视频标签

  • logger (Logger, 可选) – 与脚本关联的日志记录器

  • stats (dict, 可选) – 包含 locscale 的字典,用于 ObservationNorm 转换

  • norm_obs_only (bool, 可选) – 如果为 True 且使用 VecNorm,则奖励不会在线归一化。默认为 False

  • use_env_creator (bool, 可选) – 是否应使用 EnvCreator 类。通过使用 EnvCreator,可以在使用 VecNorm 转换时确保运行统计信息将被放入共享内存中,并可供所有工作进程访问。默认为 True

  • custom_env_maker (callable, 可选) – 如果您的环境创建器不是 torchrl 环境包装器的一部分,则可以传递自定义的可调用对象。在这种情况下,它将覆盖从 args 中检索到的构造函数。

  • custom_env (EnvBase, 可选) – 如果需要转换现有的环境,可以将其直接传递给此辅助函数。 custom_env_makercustom_env 是互斥的功能。

  • return_transformed_envs (bool, 可选) – 如果为 True,则返回转换后的环境。

  • action_dim_gsde (int, 可选) – 如果使用 gSDE,这可以表示动作维度以初始化噪声。确保这在并行执行的环境中有所指示。

  • state_dim_gsde – 如果使用 gSDE,这可以表示状态维度以初始化噪声。确保这在并行执行的环境中有所指示。

  • batch_dims (int, 可选) – 一批数据的维度数。如果使用单个环境,则应为 0(默认值)。如果多个环境正在并行转换,则应将其设置为 1(或批处理的维度数)。

  • obs_norm_state_dict (dict, 可选) – 要加载到环境中的 ObservationNorm 转换的 state_dict

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取适合初学者和高级开发人员的深度教程

查看教程

资源

查找开发资源并获得问题的解答

查看资源