BinarizeReward¶
- class torchrl.envs.transforms.BinarizeReward(in_keys: Sequence[NestedKey] | None = None, out_keys: Sequence[NestedKey] | None = None)[source]¶
如果奖励为空或非空,则将奖励映射到二进制值(0 或 1)。
- 参数:
in_keys (List[NestedKey]) – 输入键
out_keys (List[NestedKey], optional) – 输出键。默认为
in_keys
的值。dtype (torch.dtype, optional) – 二值化奖励的数据类型。默认为
torch.int8
。
- transform_reward_spec(reward_spec: TensorSpec) TensorSpec [source]¶
转换奖励规范,以便生成的规范与转换映射匹配。
- 参数:
reward_spec (TensorSpec) – 转换前的规范
- 返回值:
转换后的预期规范