NoopResetEnv¶
- class torchrl.envs.transforms.NoopResetEnv(noops: int = 30, random: bool = True)[source]¶
在环境重置时运行一系列随机动作。
- 参数:
env (EnvBase) – 必须在其上执行随机动作的环境。可以与提供给 TransformedEnv 类的环境相同
noops (int, optional) – 重置后执行的动作数的上限。默认为 30。如果 noops 过高,导致环境在所有 noops 应用之前完成或截断(在多次试验中),则转换会引发 RuntimeError。
random (bool, optional) – 如果为 False,则随机操作的数量将始终等于 noops 值。如果为 True,则随机动作的数量将在 0 到 noops 之间随机选择。默认为 True。