快捷方式

DreamerValueLoss

class torchrl.objectives.DreamerValueLoss(*args, **kwargs)[source]

Dreamer 值函数损失。

计算 Dreamer 值函数模型的损失。值函数损失计算的是预测值与 lambda 目标之间的差。

参考:https://arxiv.org/abs/1912.01603

参数:
  • value_model (TensorDictModule) – 值函数模型。

  • value_loss (str, optional) – 用于计算值函数损失的损失函数。默认为 "l2"

  • discount_loss (bool, optional) – 如果为 True,则损失会使用 gamma 折扣因子进行折扣。默认为 False。

  • gamma (float, optional) – gamma 折扣因子。默认为 0.99

default_keys

_AcceptedKeys 的别名

forward(fake_data) Tensor[source]

它被设计用于读取输入的 TensorDict 并返回另一个包含命名为“loss*”的损失键的 tensordict。

将损失分解到其组成部分后,训练器就可以在整个训练过程中记录各种损失值。输出 tensordict 中存在的其他标量也将被记录。

参数:

tensordict – 包含计算损失所需值的输入 tensordict。

返回:

一个新的不含批次维度的 tensordict,其中包含各种命名为“loss*”的损失标量。损失必须以此名称返回,因为训练器会在反向传播之前读取它们,这一点至关重要。

文档

获取 PyTorch 全面开发者文档

查看文档

教程

获取适合初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获得问题解答

查看资源