UnityMLAgentsWrapper¶

torchrl.envs.UnityMLAgentsWrapper(*args, **kwargs)[源码]¶

Unity ML-Agents 环境封装器。

GitHub: https://github.com/Unity-Technologies/ml-agents

文档：https://unity-technologies.github.io/ml-agents/Python-LLAPI/

参数：

env (mlagents_envs.environment.UnityEnvironment) – 要封装的 ML-Agents 环境。

关键字参数：

device (torch.device, 可选) – 如果提供，数据将转换到该设备。默认为 None。
batch_size (torch.Size, 可选) – 环境的批大小。默认为 torch.Size([])。
allow_done_after_reset (bool, 可选) – 如果为 True，则允许环境在调用 reset() 后立即处于 done 状态。默认为 False。
group_map (MarlGroupMapType 或 Dict[str, List[str]]], 可选) – 如何在 tensordicts 中对智能体进行分组以进行输入/输出。有关详细信息，请参阅 MarlGroupMapType。如果未指定，则智能体根据 Unity 环境提供的组 ID 进行分组。默认为 None。
categorical_actions (bool, 可选) – 如果为 True，分类规范将转换为等效的 TorchRL 类型 (torchrl.data.Categorical)，否则将使用 one-hot 编码 (torchrl.data.OneHot)。默认为 False。

变量：

available_envs – 可用于构建的已注册环境列表

示例

>>> from mlagents_envs.environment import UnityEnvironment
>>> base_env = UnityEnvironment()
>>> from torchrl.envs import UnityMLAgentsWrapper
>>> env = UnityMLAgentsWrapper(base_env)
>>> td = env.reset()
>>> td = env.step(td.update(env.full_action_spec.rand()))

UnityMLAgentsWrapper¶

文档

教程

资源