DreamerValueLoss¶
- class torchrl.objectives.DreamerValueLoss(*args, **kwargs)[source]¶
Dreamer 值损失。
计算梦想家值模型的损失。值损失是在预测值和 lambda 目标之间计算的。
参考:https://arxiv.org/abs/1912.01603。
- 参数:
value_model (TensorDictModule) – 值模型。
value_loss (str, optional) – 用于值损失的损失。默认值:
"l2"
。discount_loss (bool, optional) – 如果为
True
,则损失将使用 gamma 折扣因子进行折扣。默认值:False。gamma (float, optional) – gamma 折扣因子。默认值:
0.99
。