快捷方式

值估计器

class torchrl.objectives.ValueEstimators(value)[source]

用于自定义构建估计器的值函数枚举器。

当损失模块允许时,允许灵活使用各种值函数。

示例

>>> dqn_loss = DQNLoss(actor)
>>> dqn_loss.make_value_estimator(ValueEstimators.TD0, gamma=0.9)

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取面向初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并获得问题的解答

查看资源