快捷方式

RSSMPosterior

class torchrl.modules.RSSMPosterior(hidden_dim=200, state_dim=30, scale_lb=0.1)[source]

RSSM 的后验网络。

此网络将信念和相关的编码观测作为输入。它返回后验的参数以及根据此分布采样的状态。

参考: https://arxiv.org/abs/1811.04551

参数:
  • hidden_dim (int, optional) – 线性网络中的隐藏单元数。默认为 200。

  • state_dim (int, optional) – 状态的大小。默认为 30。

  • scale_lb (float, optional) – 状态分布的比例下限。默认为 0.1。

forward(belief, obs_embedding)[source]

定义每次调用时执行的计算。

应由所有子类重写。

注意

尽管前向传递的配方需要在该函数中定义,但应在此之后调用 Module 实例,而不是调用此函数,因为前者负责运行注册的钩子,而后者会静默地忽略它们。

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取面向初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获得您的问题解答

查看资源