LogReward¶
- class torchrl.trainers.LogReward(logname='r_training', log_pbar: bool = False, reward_key: Optional[Union[str, tuple]] = None)[源代码]¶
奖励日志记录钩子。
- 参数:
logname (str, 可选) – 要记录的奖励的名称。默认为
"r_training"
。log_pbar (bool, 可选) – 如果为
True
,则奖励值将记录在进度条上。默认为False
。reward_key (str 或 tuple, 可选) – 在输入批次中查找奖励的键。默认为
("next", "reward")
示例
>>> log_reward = LogReward(("next", "reward")) >>> trainer.register_op("pre_steps_log", log_reward)