VIPRewardTransform¶
- class torchrl.envs.transforms.VIPRewardTransform(*args, **kwargs)[源代码]¶
一个 VIP 转换,用于根据嵌入相似度计算奖励。
此类将更新奖励计算
- transform_input_spec(input_spec: TensorSpec) TensorSpec [源代码]¶
转换输入规范,以便生成的规范与转换映射匹配。
- 参数::
input_spec (TensorSpec) – 转换前的规范
- 返回值::
转换后的预期规范