快捷方式

估值器

class torchrl.objectives.ValueEstimators(value)[source]

用于自定义构建估值器的价值函数枚举器。

在损失模块允许的情况下,支持灵活使用各种价值函数。

示例

>>> dqn_loss = DQNLoss(actor)
>>> dqn_loss.make_value_estimator(ValueEstimators.TD0, gamma=0.9)

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

获取面向初学者和高级开发者的深度教程

查看教程

资源

查找开发资源并获得解答

查看资源