transformed_env_constructor¶

torchrl.trainers.helpers.transformed_env_constructor(cfg: DictConfig, video_tag: str = '', logger: Optional[Logger] = None, stats: Optional[dict] = None, norm_obs_only: bool = False, use_env_creator: bool = True, custom_env_maker: Optional[Callable] = None, custom_env: Optional[EnvBase] = None, return_transformed_envs: bool = True, action_dim_gsde: Optional[int] = None, state_dim_gsde: Optional[int] = None, batch_dims: Optional[int] = 0, obs_norm_state_dict: Optional[dict] = None) → Union[Callable, EnvCreator][source]¶

根据使用适当的解析器构造函数构建的 argparse.Namespace 返回一个环境创建器。

参数:

cfg (DictConfig) – 一个包含脚本参数的 DictConfig。
video_tag (str, optional) – 要传递给 Logger 对象的视频标签
logger (Logger, optional) – 与脚本关联的 logger
stats (dict, optional) – 一个包含 loc 和 scale 用于 ObservationNorm transform 的字典
norm_obs_only (bool, optional) – 如果为 True 且使用了 VecNorm，则奖励不会在线进行归一化。默认为 False。
use_env_creator (bool, optional) – 是否应使用 EnvCreator 类。通过使用 EnvCreator，可以确保在使用 VecNorm transform 时，运行统计数据将被放入共享内存并可供所有 worker 访问。默认为 True。
custom_env_maker (callable, optional) – 如果你的环境创建器不是 torchrl 环境包装器的一部分，可以传递一个自定义的可调用对象。在这种情况下，它将覆盖从 args 中检索到的构造函数。
custom_env (EnvBase, optional) – 如果需要对现有环境进行 transformed_in，可以直接将其传递给此 helper。custom_env_maker 和 custom_env 是互斥的特性。
return_transformed_envs (bool, optional) – 如果 True，则返回一个 transformed_in 环境。
action_dim_gsde (int, Optional) – 如果使用 gSDE，这可以表示用于初始化噪声的动作维度。请确保在并行执行的环境中指示此值。
state_dim_gsde – 如果使用 gSDE，这可以表示用于初始化噪声的状态维度。请确保在并行执行的环境中指示此值。
batch_dims (int, optional) – 数据批次的维度数。如果使用单个环境，应设置为 0（默认）。如果多个环境并行进行 transformed，应设置为 1（或批次的维度数）。
obs_norm_state_dict (dict, optional) – 要加载到环境中的 ObservationNorm transform 的 state_dict

transformed_env_constructor¶

文档

教程

资源