RSSMPosterior¶
- class torchrl.modules.RSSMPosterior(hidden_dim=200, state_dim=30, scale_lb=0.1)[source]¶
RSSM 的后验网络。
此网络将信念和相关的编码观测作为输入。它返回后验的参数以及根据此分布采样的状态。
参考: https://arxiv.org/abs/1811.04551
- 参数:
hidden_dim (int, optional) – 线性网络中的隐藏单元数。默认为 200。
state_dim (int, optional) – 状态的大小。默认为 30。
scale_lb (float, optional) – 状态分布的比例下限。默认为 0.1。