RSSMPosterior¶
- class torchrl.modules.RSSMPosterior(hidden_dim=200, state_dim=30, scale_lb=0.1)[source]¶
RSSM 的后验网络。
此网络以信念和相关的编码观察作为输入。它返回后验的参数以及根据此分布采样的状态。
参考:https://arxiv.org/abs/1811.04551
- 参数:
hidden_dim (int, 可选) – 线性网络中隐藏单元的数量。默认为 200。
state_dim (int, 可选) – 状态的大小。默认为 30。
scale_lb (float, 可选) – 状态分布尺度的下限。默认为 0.1。