索引 A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Z A A2CLoss (torchrl.objectives 中的类) action_key (torchrl.envs.EnvBase 属性) (torchrl.envs.GymLikeEnv 属性) (torchrl.envs.ParallelEnv 属性) (torchrl.envs.PendulumEnv 属性) (torchrl.envs.SerialEnv 属性) (torchrl.envs.TicTacToeEnv 属性) action_keys (torchrl.envs.EnvBase 属性) (torchrl.envs.GymLikeEnv 属性) (torchrl.envs.ParallelEnv 属性) (torchrl.envs.PendulumEnv 属性) (torchrl.envs.SerialEnv 属性) (torchrl.envs.TicTacToeEnv 属性) action_spec (torchrl.envs.EnvBase 属性) (torchrl.envs.GymLikeEnv 属性) (torchrl.envs.ParallelEnv 属性) (torchrl.envs.PendulumEnv 属性) (torchrl.envs.SerialEnv 属性) (torchrl.envs.TicTacToeEnv 属性) ActionDiscretizer (torchrl.envs.transforms 中的类) ActionDiscretizer.SamplingStrategy (torchrl.envs.transforms 中的类) ActionMask (torchrl.envs.transforms 中的类) Actor (torchrl.modules.tensordict_module 中的类) actor_loss() (torchrl.objectives.TD3BCLoss 方法) ActorCriticOperator (torchrl.modules.tensordict_module 中的类) ActorCriticWrapper (torchrl.modules.tensordict_module 中的类) ActorValueOperator (torchrl.modules.tensordict_module 中的类) AdaptiveKLController (torchrl.data 中的类) add() (torchrl.data.datasets.AtariDQNExperienceReplay 方法) (torchrl.data.datasets.BaseDatasetExperienceReplay 方法) (torchrl.data.datasets.D4RLExperienceReplay 方法) (torchrl.data.datasets.GenDGRLExperienceReplay 方法) (torchrl.data.datasets.MinariExperienceReplay 方法) (torchrl.data.datasets.OpenMLExperienceReplay 方法) (torchrl.data.datasets.OpenXExperienceReplay 方法) (torchrl.data.datasets.RobosetExperienceReplay 方法) (torchrl.data.datasets.VD4RLExperienceReplay 方法) (torchrl.data.PrioritizedReplayBuffer 方法) (torchrl.data.replay_buffers.ImmutableDatasetWriter 方法) (torchrl.data.replay_buffers.ReplayBufferEnsemble 方法) (torchrl.data.replay_buffers.RoundRobinWriter 方法) (torchrl.data.replay_buffers.TensorDictMaxValueWriter 方法) (torchrl.data.replay_buffers.TensorDictRoundRobinWriter 方法) (torchrl.data.replay_buffers.Writer 方法) (torchrl.data.replay_buffers.WriterEnsemble 方法) (torchrl.data.ReplayBuffer 方法) (torchrl.data.TensorDictPrioritizedReplayBuffer 方法) (torchrl.data.TensorDictReplayBuffer 方法) add_collectors() (torchrl.collectors.distributed.RayCollector 方法) add_module() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) add_truncated_keys() (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.TransformedEnv 方法) AdditiveGaussianModule (torchrl.modules.tensordict_module 中的类) AdditiveGaussianWrapper (torchrl.modules.tensordict_module 中的类) append() (torchrl.envs.transforms.Compose 方法) append_transform() (torchrl.data.datasets.AtariDQNExperienceReplay 方法) (torchrl.data.datasets.BaseDatasetExperienceReplay 方法) (torchrl.data.datasets.D4RLExperienceReplay 方法) (torchrl.data.datasets.GenDGRLExperienceReplay 方法) (torchrl.data.datasets.MinariExperienceReplay 方法) (torchrl.data.datasets.OpenMLExperienceReplay 方法) (torchrl.data.datasets.OpenXExperienceReplay 方法) (torchrl.data.datasets.RobosetExperienceReplay 方法) (torchrl.data.datasets.VD4RLExperienceReplay 方法) (torchrl.data.PrioritizedReplayBuffer 方法) (torchrl.data.replay_buffers.ReplayBufferEnsemble 方法) (torchrl.data.ReplayBuffer 方法) (torchrl.data.TensorDictPrioritizedReplayBuffer 方法) (torchrl.data.TensorDictReplayBuffer 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.TransformedEnv 方法) apply() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) assert_is_in() (torchrl.data.BinaryDiscreteTensorSpec 方法) (torchrl.data.BoundedTensorSpec 方法) (torchrl.data.CompositeSpec 方法) (torchrl.data.DiscreteTensorSpec 方法) (torchrl.data.LazyStackedCompositeSpec 方法) (torchrl.data.LazyStackedTensorSpec 方法) (torchrl.data.MultiDiscreteTensorSpec 方法) (torchrl.data.MultiOneHotDiscreteTensorSpec 方法) (torchrl.data.NonTensorSpec 方法) (torchrl.data.OneHotDiscreteTensorSpec 方法) (torchrl.data.TensorSpec 方法) (torchrl.data.UnboundedContinuousTensorSpec 方法) (torchrl.data.UnboundedDiscreteTensorSpec 方法) aSyncDataCollector (torchrl.collectors 中的类) AtariDQNExperienceReplay (torchrl.data.datasets 中的类) attach() (torchrl.data.replay_buffers.LazyMemmapStorage 方法) (torchrl.data.replay_buffers.LazyTensorStorage 方法) (torchrl.data.replay_buffers.ListStorage 方法) (torchrl.data.replay_buffers.Storage 方法) (torchrl.data.replay_buffers.StorageEnsemble 方法) (torchrl.data.replay_buffers.TensorStorage 方法) auto_register_info_dict() (torchrl.envs.GymLikeEnv 方法) AutoResetEnv (torchrl.envs.transforms 中的类) AutoResetTransform (torchrl.envs.transforms 中的类) B BaseDatasetExperienceReplay (torchrl.data.datasets 中的类) batch_locked (torchrl.envs.EnvBase 属性) (torchrl.envs.GymLikeEnv 属性) (torchrl.envs.ParallelEnv 属性) (torchrl.envs.SerialEnv 属性) (torchrl.envs.transforms.TransformedEnv 属性) batch_size (torchrl.data.PairwiseDataset 属性) (torchrl.data.PromptData 属性) (torchrl.data.RewardData 属性) (torchrl.envs.EnvBase 属性) (torchrl.envs.GymLikeEnv 属性) (torchrl.envs.ParallelEnv 属性) (torchrl.envs.PendulumEnv 属性) (torchrl.envs.SerialEnv 属性) (torchrl.envs.TicTacToeEnv 属性) (torchrl.envs.transforms.TransformedEnv 属性) BatchSizeTransform (torchrl.envs.transforms 中的类) BatchSubSampler (torchrl.trainers 中的类) bfloat16() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) biased_softplus (torchrl.modules.utils 中的类) BinarizeReward (torchrl.envs.transforms 中的类) BinaryDiscreteTensorSpec (torchrl.data 中的类) BoundedTensorSpec (torchrl.data 中的类) BraxEnv() (在 torchrl.envs 模块中) BraxWrapper() (在 torchrl.envs 模块中) buffers() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) build_td_for_shared_vecnorm() (torchrl.envs.transforms.VecNorm 静态方法) BurnInTransform (torchrl.envs.transforms 中的类) C CatFrames (torchrl.envs.transforms 中的类) CatTensors (torchrl.envs.transforms 中的类) CEMPlanner (torchrl.modules 中的类) CenterCrop (torchrl.envs.transforms 中的类) check_env_specs() (在 torchrl.envs.utils 模块中) check_marl_grouping() (在 torchrl.envs 模块中) check_no_exclusive_keys (torchrl.data 中的类) children() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) clear_device_() (torchrl.data.BinaryDiscreteTensorSpec 方法) (torchrl.data.BoundedTensorSpec 方法) (torchrl.data.CompositeSpec 方法) (torchrl.data.DiscreteTensorSpec 方法) (torchrl.data.LazyStackedCompositeSpec 方法) (torchrl.data.LazyStackedTensorSpec 方法) (torchrl.data.MultiDiscreteTensorSpec 方法) (torchrl.data.MultiOneHotDiscreteTensorSpec 方法) (torchrl.data.NonTensorSpec 方法) (torchrl.data.OneHotDiscreteTensorSpec 方法) (torchrl.data.TensorSpec 方法) (torchrl.data.UnboundedContinuousTensorSpec 方法) (torchrl.data.UnboundedDiscreteTensorSpec 方法) ClearCudaCache (torchrl.trainers 中的类) ClipPPOLoss (torchrl.objectives 中的类) ClipTransform (torchrl.envs.transforms 中的类) close() (torchrl.envs.GymLikeEnv 方法) compile() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) Compose (torchrl.envs.transforms 中的类) CompositeSpec (torchrl.data 中的类) consolidate_spec (torchrl.data 中的类) ConstantKLController (torchrl.data 中的类) container (torchrl.envs.transforms.rb_transforms.MultiStepTransform 属性) (torchrl.envs.transforms.Transform 属性) contains() (torchrl.data.BinaryDiscreteTensorSpec 方法) (torchrl.data.BoundedTensorSpec 方法) (torchrl.data.CompositeSpec 方法) (torchrl.data.DiscreteTensorSpec 方法) (torchrl.data.LazyStackedCompositeSpec 方法) (torchrl.data.LazyStackedTensorSpec 方法) (torchrl.data.MultiDiscreteTensorSpec 方法) (torchrl.data.MultiOneHotDiscreteTensorSpec 方法) (torchrl.data.NonTensorSpec 方法) (torchrl.data.OneHotDiscreteTensorSpec 方法) (torchrl.data.TensorSpec 方法) (torchrl.data.UnboundedContinuousTensorSpec 方法) (torchrl.data.UnboundedDiscreteTensorSpec 方法) contains_lazy_spec (torchrl.data 中的类) Conv3dNet (torchrl.modules 中的类) convert_to_functional() (torchrl.objectives.LossModule 方法) ConvNet (torchrl.modules 中的类) correct_for_frame_skip() (在 torchrl.trainers.helpers 模块中) CountFramesLog (torchrl.trainers 中的类) cpu() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) CQLLoss (torchrl.objectives 中的类) create_infinite_iterator (torchrl.data 中的类) create_rollout_td() (torchrl.data.RolloutFromModel 方法) Crop (torchrl.envs.transforms 中的类) CSVLogger() (在 torchrl.record.loggers.csv 模块中) cuda() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) D D4RLExperienceReplay (torchrl.data.datasets 中的类) data_path (torchrl.data.datasets.AtariDQNExperienceReplay 属性) (torchrl.data.datasets.BaseDatasetExperienceReplay 属性) (torchrl.data.datasets.D4RLExperienceReplay 属性) (torchrl.data.datasets.GenDGRLExperienceReplay 属性) (torchrl.data.datasets.MinariExperienceReplay 属性) (torchrl.data.datasets.OpenMLExperienceReplay 属性) (torchrl.data.datasets.OpenXExperienceReplay 属性) (torchrl.data.datasets.RobosetExperienceReplay 属性) (torchrl.data.datasets.VD4RLExperienceReplay 属性) data_path_root (torchrl.data.datasets.AtariDQNExperienceReplay 属性) (torchrl.data.datasets.BaseDatasetExperienceReplay 属性) (torchrl.data.datasets.D4RLExperienceReplay 属性) (torchrl.data.datasets.GenDGRLExperienceReplay 属性) (torchrl.data.datasets.MinariExperienceReplay 属性) (torchrl.data.datasets.OpenMLExperienceReplay 属性) (torchrl.data.datasets.OpenXExperienceReplay 属性) (torchrl.data.datasets.RobosetExperienceReplay 属性) (torchrl.data.datasets.VD4RLExperienceReplay 属性) DataCollectorBase (torchrl.collectors 中的类) dataset_to_tensordict() (torchrl.data.TokenizedDatasetLoader 静态方法) DdpgCnnActor (torchrl.modules 中的类) DdpgCnnQNet (torchrl.modules 中的类) DDPGLoss (torchrl.objectives 中的类) DdpgMlpActor (torchrl.modules 中的类) DdpgMlpQNet (torchrl.modules 中的类) DecisionTransformer (torchrl.modules 中的类) DecisionTransformer.DTConfig (torchrl.modules 中的类) DecisionTransformerInferenceWrapper (torchrl.modules.tensordict_module 中的类) default_config() (torchrl.modules.DTActor 类方法) (torchrl.modules.OnlineDTActor 类方法) default_value_kwargs (torchrl.objectives 中的类) delete() (torchrl.data.datasets.AtariDQNExperienceReplay 方法) (torchrl.data.datasets.BaseDatasetExperienceReplay 方法) (torchrl.data.datasets.D4RLExperienceReplay 方法) (torchrl.data.datasets.GenDGRLExperienceReplay 方法) (torchrl.data.datasets.MinariExperienceReplay 方法) (torchrl.data.datasets.OpenMLExperienceReplay 方法) (torchrl.data.datasets.OpenXExperienceReplay 方法) (torchrl.data.datasets.RobosetExperienceReplay 方法) (torchrl.data.datasets.VD4RLExperienceReplay 方法) Delta (torchrl.modules 中的类) device (torchrl.data.PairwiseDataset 属性) (torchrl.data.PromptData 属性) (torchrl.data.RewardData 属性) DeviceCastTransform (torchrl.envs.transforms 中的类) DiscreteActionProjection (torchrl.envs.transforms 中的类) DiscreteCQLLoss (torchrl.objectives 中的类) DiscreteIQLLoss (torchrl.objectives 中的类) DiscreteSACLoss (torchrl.objectives 中的类) DiscreteTensorSpec (torchrl.data 中的类) distance_loss (torchrl.objectives 中的类) DistributedDataCollector (torchrl.collectors.distributed 中的类) DistributedSyncDataCollector (torchrl.collectors.distributed 中的类) DistributionalDQNLoss (torchrl.objectives 中的类) DistributionalDQNnet (torchrl.modules 中的类) DistributionalQValueActor (torchrl.modules.tensordict_module 中的类) DistributionalQValueHook (torchrl.modules 中的类) DistributionalQValueModule (torchrl.modules.tensordict_module 中的类) DMControlEnv() (在 torchrl.envs 模块中) DMControlWrapper() (在 torchrl.envs 模块中) done_key (torchrl.envs.EnvBase 属性) (torchrl.envs.GymLikeEnv 属性) (torchrl.envs.ParallelEnv 属性) (torchrl.envs.PendulumEnv 属性) (torchrl.envs.SerialEnv 属性) (torchrl.envs.TicTacToeEnv 属性) done_keys (torchrl.envs.EnvBase 属性) (torchrl.envs.GymLikeEnv 属性) (torchrl.envs.ParallelEnv 属性) (torchrl.envs.PendulumEnv 属性) (torchrl.envs.SerialEnv 属性) (torchrl.envs.TicTacToeEnv 属性) done_keys_groups (torchrl.envs.EnvBase 属性) (torchrl.envs.GymLikeEnv 属性) (torchrl.envs.ParallelEnv 属性) (torchrl.envs.PendulumEnv 属性) (torchrl.envs.SerialEnv 属性) (torchrl.envs.TicTacToeEnv 属性) done_spec (torchrl.envs.EnvBase 属性) (torchrl.envs.GymLikeEnv 属性) (torchrl.envs.ParallelEnv 属性) (torchrl.envs.PendulumEnv 属性) (torchrl.envs.SerialEnv 属性) (torchrl.envs.TicTacToeEnv 属性) double() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) DoubleToFloat (torchrl.envs.transforms 中的类) DQNLoss (torchrl.objectives 中的类) DreamerActor (torchrl.modules 中的类) DreamerActorLoss (torchrl.objectives 中的类) DreamerDecoder() (在 torchrl.envs.model_based.dreamer 模块中) DreamerEnv() (在 torchrl.envs.model_based.dreamer 模块中) DreamerModelLoss (torchrl.objectives 中的类) DreamerValueLoss (torchrl.objectives 中的类) DTActor (torchrl.modules 中的类) DTLoss (torchrl.objectives 中的类) DTypeCastTransform (torchrl.envs.transforms 中的类) DuelingCnnDQNet (torchrl.modules 中的类) dump() (torchrl.data.datasets.AtariDQNExperienceReplay 方法) (torchrl.data.datasets.BaseDatasetExperienceReplay 方法) (torchrl.data.datasets.D4RLExperienceReplay 方法) (torchrl.data.datasets.GenDGRLExperienceReplay 方法) (torchrl.data.datasets.MinariExperienceReplay 方法) (torchrl.data.datasets.OpenMLExperienceReplay 方法) (torchrl.data.datasets.OpenXExperienceReplay 方法) (torchrl.data.datasets.RobosetExperienceReplay 方法) (torchrl.data.datasets.VD4RLExperienceReplay 方法) (torchrl.data.PrioritizedReplayBuffer 方法) (torchrl.data.replay_buffers.LazyMemmapStorage 方法) (torchrl.data.replay_buffers.LazyTensorStorage 方法) (torchrl.data.replay_buffers.ListStorage 方法) (torchrl.data.replay_buffers.ReplayBufferEnsemble 方法) (torchrl.data.replay_buffers.Storage 方法) (torchrl.data.replay_buffers.StorageEnsemble 方法) (torchrl.data.replay_buffers.TensorStorage 方法) (torchrl.data.ReplayBuffer 方法) (torchrl.data.TensorDictPrioritizedReplayBuffer 方法) (torchrl.data.TensorDictReplayBuffer 方法) dumps() (torchrl.data.datasets.AtariDQNExperienceReplay 方法) (torchrl.data.datasets.BaseDatasetExperienceReplay 方法) (torchrl.data.datasets.D4RLExperienceReplay 方法) (torchrl.data.datasets.GenDGRLExperienceReplay 方法) (torchrl.data.datasets.MinariExperienceReplay 方法) (torchrl.data.datasets.OpenMLExperienceReplay 方法) (torchrl.data.datasets.OpenXExperienceReplay 方法) (torchrl.data.datasets.RobosetExperienceReplay 方法) (torchrl.data.datasets.VD4RLExperienceReplay 方法) (torchrl.data.PrioritizedReplayBuffer 方法) (torchrl.data.replay_buffers.ReplayBufferEnsemble 方法) (torchrl.data.ReplayBuffer 方法) (torchrl.data.TensorDictPrioritizedReplayBuffer 方法) (torchrl.data.TensorDictReplayBuffer 方法) E EGreedyModule (torchrl.modules.tensordict_module 中的类) EGreedyWrapper (torchrl.modules.tensordict_module 中的类) empty() (torchrl.data.CompositeSpec 方法) (torchrl.data.datasets.AtariDQNExperienceReplay 方法) (torchrl.data.datasets.BaseDatasetExperienceReplay 方法) (torchrl.data.datasets.D4RLExperienceReplay 方法) (torchrl.data.datasets.GenDGRLExperienceReplay 方法) (torchrl.data.datasets.MinariExperienceReplay 方法) (torchrl.data.datasets.OpenMLExperienceReplay 方法) (torchrl.data.datasets.OpenXExperienceReplay 方法) (torchrl.data.datasets.RobosetExperienceReplay 方法) (torchrl.data.datasets.VD4RLExperienceReplay 方法) (torchrl.data.LazyStackedCompositeSpec 方法) (torchrl.data.PrioritizedReplayBuffer 方法) (torchrl.data.replay_buffers.ReplayBufferEnsemble 方法) (torchrl.data.ReplayBuffer 方法) (torchrl.data.TensorDictPrioritizedReplayBuffer 方法) (torchrl.data.TensorDictReplayBuffer 方法) empty_cache() (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.TransformedEnv 方法) encode() (torchrl.data.BinaryDiscreteTensorSpec 方法) (torchrl.data.BoundedTensorSpec 方法) (torchrl.data.CompositeSpec 方法) (torchrl.data.DiscreteTensorSpec 方法) (torchrl.data.LazyStackedCompositeSpec 方法) (torchrl.data.LazyStackedTensorSpec 方法) (torchrl.data.MultiDiscreteTensorSpec 方法) (torchrl.data.MultiOneHotDiscreteTensorSpec 方法) (torchrl.data.NonTensorSpec 方法) (torchrl.data.OneHotDiscreteTensorSpec 方法) (torchrl.data.TensorSpec 方法) (torchrl.data.UnboundedContinuousTensorSpec 方法) (torchrl.data.UnboundedDiscreteTensorSpec 方法) EndOfLifeTransform (torchrl.envs.transforms 中的类) EnvBase (torchrl.envs 中的类) EnvCreator (torchrl.envs 中的类) EnvMetaData (torchrl.envs 中的类) eval() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) (torchrl.envs.transforms.TransformedEnv 方法) ExcludeTransform (torchrl.envs.transforms 中的类) expand() (torchrl.data.BinaryDiscreteTensorSpec 方法) (torchrl.data.BoundedTensorSpec 方法) (torchrl.data.CompositeSpec 方法) (torchrl.data.DiscreteTensorSpec 方法) (torchrl.data.LazyStackedCompositeSpec 方法) (torchrl.data.LazyStackedTensorSpec 方法) (torchrl.data.MultiDiscreteTensorSpec 方法) (torchrl.data.MultiOneHotDiscreteTensorSpec 方法) (torchrl.data.NonTensorSpec 方法) (torchrl.data.OneHotDiscreteTensorSpec 方法) (torchrl.data.TensorSpec 方法) (torchrl.data.UnboundedContinuousTensorSpec 方法) (torchrl.data.UnboundedDiscreteTensorSpec 方法) exploration_mode() (在 torchrl.envs.utils 模块中) exploration_type() (在 torchrl.envs.utils 模块中) extend() (torchrl.data.datasets.AtariDQNExperienceReplay 方法) (torchrl.data.datasets.BaseDatasetExperienceReplay 方法) (torchrl.data.datasets.D4RLExperienceReplay 方法) (torchrl.data.datasets.GenDGRLExperienceReplay 方法) (torchrl.data.datasets.MinariExperienceReplay 方法) (torchrl.data.datasets.OpenMLExperienceReplay 方法) (torchrl.data.datasets.OpenXExperienceReplay 方法) (torchrl.data.datasets.RobosetExperienceReplay 方法) (torchrl.data.datasets.VD4RLExperienceReplay 方法) (torchrl.data.PrioritizedReplayBuffer 方法) (torchrl.data.replay_buffers.ImmutableDatasetWriter 方法) (torchrl.data.replay_buffers.ReplayBufferEnsemble 方法) (torchrl.data.replay_buffers.RoundRobinWriter 方法) (torchrl.data.replay_buffers.TensorDictMaxValueWriter 方法) (torchrl.data.replay_buffers.TensorDictRoundRobinWriter 方法) (torchrl.data.replay_buffers.Writer 方法) (torchrl.data.replay_buffers.WriterEnsemble 方法) (torchrl.data.ReplayBuffer 方法) (torchrl.data.TensorDictPrioritizedReplayBuffer 方法) (torchrl.data.TensorDictReplayBuffer 方法) extra_repr() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) F fake_tensordict() (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) FiniteTensorDictCheck (torchrl.envs.transforms 中的类) Flat2TED (torchrl.data 中的类) FlatStorageCheckpointer (torchrl.data.replay_buffers 中的类) flatten() (torchrl.data.BinaryDiscreteTensorSpec 方法) (torchrl.data.BoundedTensorSpec 方法) (torchrl.data.CompositeSpec 方法) (torchrl.data.DiscreteTensorSpec 方法) (torchrl.data.LazyStackedCompositeSpec 方法) (torchrl.data.LazyStackedTensorSpec 方法) (torchrl.data.MultiDiscreteTensorSpec 方法) (torchrl.data.MultiOneHotDiscreteTensorSpec 方法) (torchrl.data.NonTensorSpec 方法) (torchrl.data.OneHotDiscreteTensorSpec 方法) (torchrl.data.TensorSpec 方法) (torchrl.data.UnboundedContinuousTensorSpec 方法) (torchrl.data.UnboundedDiscreteTensorSpec 方法) FlattenObservation (torchrl.envs.transforms 中的类) float() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) forward() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.ActionMask 方法) (torchrl.envs.transforms.AutoResetTransform 方法) (torchrl.envs.transforms.BatchSizeTransform 方法) (torchrl.envs.transforms.BurnInTransform 方法) (torchrl.envs.transforms.CatFrames 方法) (torchrl.envs.transforms.CatTensors 方法) (torchrl.envs.transforms.Compose 方法) (torchrl.envs.transforms.DeviceCastTransform 方法) (torchrl.envs.transforms.DTypeCastTransform 方法) (torchrl.envs.transforms.EndOfLifeTransform 方法) (torchrl.envs.transforms.ExcludeTransform 方法) (torchrl.envs.transforms.FiniteTensorDictCheck 方法) (torchrl.envs.transforms.FlattenObservation 方法) (torchrl.envs.transforms.FrameSkipTransform 方法) (torchrl.envs.transforms.InitTracker 方法) (torchrl.envs.transforms.KLRewardTransform 方法) (torchrl.envs.transforms.PinMemoryTransform 方法) (torchrl.envs.transforms.RandomCropTensorDict 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) (torchrl.envs.transforms.RemoveEmptySpecs 方法) (torchrl.envs.transforms.RenameTransform 方法) (torchrl.envs.transforms.Reward2GoTransform 方法) (torchrl.envs.transforms.RewardSum 方法) (torchrl.envs.transforms.SelectTransform 方法) (torchrl.envs.transforms.StepCounter 方法) (torchrl.envs.transforms.TargetReturn 方法) (torchrl.envs.transforms.TensorDictPrimer 方法) (torchrl.envs.transforms.TimeMaxPool 方法) (torchrl.envs.transforms.Transform 方法) (torchrl.envs.transforms.VC1Transform 方法) (torchrl.envs.transforms.VecGymEnvTransform 方法) (torchrl.envs.transforms.VecNorm 方法) (torchrl.envs.transforms.VIPRewardTransform 方法) (torchrl.modules.Conv3dNet 方法) (torchrl.modules.ConvNet 方法) (torchrl.modules.DdpgCnnActor 方法) (torchrl.modules.DdpgCnnQNet 方法) (torchrl.modules.DdpgMlpActor 方法) (torchrl.modules.DdpgMlpQNet 方法) (torchrl.modules.DecisionTransformer 方法) (torchrl.modules.DistributionalDQNnet 方法) (torchrl.modules.DreamerActor 方法) (torchrl.modules.DTActor 方法) (torchrl.modules.DuelingCnnDQNet 方法) (torchrl.modules.GRU 方法) (torchrl.modules.GRUCell 方法) (torchrl.modules.GRUModule 方法) (torchrl.modules.LSTM 方法) (torchrl.modules.LSTMCell 方法) (torchrl.modules.LSTMModule 方法) (torchrl.modules.MLP 方法) (torchrl.modules.MPCPlannerBase 方法) (torchrl.modules.MultiAgentNetBase 方法) (torchrl.modules.NormalParamWrapper 方法) (torchrl.modules.ObsDecoder 方法) (torchrl.modules.ObsEncoder 方法) (torchrl.modules.OnlineDTActor 方法) (torchrl.modules.RSSMPosterior 方法) (torchrl.modules.RSSMPrior 方法) (torchrl.modules.SqueezeLayer 方法) (torchrl.modules.tensordict_module.AdditiveGaussianModule 方法) (torchrl.modules.tensordict_module.AdditiveGaussianWrapper 方法) (torchrl.modules.tensordict_module.DecisionTransformerInferenceWrapper 方法) (torchrl.modules.tensordict_module.DistributionalQValueModule 方法) (torchrl.modules.tensordict_module.EGreedyModule 方法) (torchrl.modules.tensordict_module.MultiStepActorWrapper 方法) (torchrl.modules.tensordict_module.OrnsteinUhlenbeckProcessModule 方法) (torchrl.modules.tensordict_module.OrnsteinUhlenbeckProcessWrapper 方法) (torchrl.modules.tensordict_module.QValueModule 方法) (torchrl.modules.tensordict_module.TanhModule 方法) (torchrl.modules.utils.biased_softplus 方法) (torchrl.modules.VmapModule 方法) (torchrl.objectives.A2CLoss 方法) (torchrl.objectives.ClipPPOLoss 方法) (torchrl.objectives.CQLLoss 方法) (torchrl.objectives.DDPGLoss 方法) (torchrl.objectives.DiscreteCQLLoss 方法) (torchrl.objectives.DiscreteIQLLoss 方法) (torchrl.objectives.DiscreteSACLoss 方法) (torchrl.objectives.DistributionalDQNLoss 方法) (torchrl.objectives.DQNLoss 方法) (torchrl.objectives.DreamerActorLoss 方法) (torchrl.objectives.DreamerModelLoss 方法) (torchrl.objectives.DreamerValueLoss 方法) (torchrl.objectives.DTLoss 方法) (torchrl.objectives.IQLLoss 方法) (torchrl.objectives.KLPENPPOLoss 方法) (torchrl.objectives.LossModule 方法) (torchrl.objectives.multiagent.QMixerLoss 方法) (torchrl.objectives.OnlineDTLoss 方法) (torchrl.objectives.PPOLoss 方法) (torchrl.objectives.REDQLoss 方法) (torchrl.objectives.ReinforceLoss 方法) (torchrl.objectives.SACLoss 方法) (torchrl.objectives.TD3BCLoss 方法) (torchrl.objectives.TD3Loss 方法) (torchrl.objectives.value.GAE 方法) (torchrl.objectives.value.TD0Estimator 方法) (torchrl.objectives.value.TD1Estimator 方法) (torchrl.objectives.value.TDLambdaEstimator 方法) (torchrl.objectives.value.ValueEstimatorBase 方法) FrameSkipTransform (torchrl.envs.transforms 中的类) freeze() (torchrl.envs.transforms.VecNorm 方法) from_dataset() (torchrl.data.PairwiseDataset 类方法) (torchrl.data.PromptData 类方法) from_stateful_net() (torchrl.modules.MultiAgentNetBase 方法) (torchrl.objectives.LossModule 方法) from_tensordict() (torchrl.data.PairwiseDataset 类方法) (torchrl.data.PromptData 类方法) (torchrl.data.RewardData 类方法) frozen_copy() (torchrl.envs.transforms.VecNorm 方法) full_action_spec (torchrl.envs.EnvBase 属性) (torchrl.envs.GymLikeEnv 属性) (torchrl.envs.ParallelEnv 属性) (torchrl.envs.PendulumEnv 属性) (torchrl.envs.SerialEnv 属性) (torchrl.envs.TicTacToeEnv 属性) full_done_spec (torchrl.envs.EnvBase 属性) (torchrl.envs.GymLikeEnv 属性) (torchrl.envs.ParallelEnv 属性) (torchrl.envs.PendulumEnv 属性) (torchrl.envs.SerialEnv 属性) (torchrl.envs.TicTacToeEnv 属性) full_reward_spec (torchrl.envs.EnvBase 属性) (torchrl.envs.GymLikeEnv 属性) (torchrl.envs.ParallelEnv 属性) (torchrl.envs.PendulumEnv 属性) (torchrl.envs.SerialEnv 属性) (torchrl.envs.TicTacToeEnv 属性) full_state_spec (torchrl.envs.EnvBase 属性) (torchrl.envs.GymLikeEnv 属性) (torchrl.envs.ParallelEnv 属性) (torchrl.envs.PendulumEnv 属性) (torchrl.envs.SerialEnv 属性) (torchrl.envs.TicTacToeEnv 属性) functional (torchrl.objectives.A2CLoss 属性) (torchrl.objectives.LossModule 属性) (torchrl.objectives.PPOLoss 属性) (torchrl.objectives.ReinforceLoss 属性) G GAE (torchrl.objectives.value 中的类) gen_params() (torchrl.envs.PendulumEnv 静态方法) GenDGRLExperienceReplay (torchrl.data.datasets 中的类) generalized_advantage_estimate (torchrl.objectives.value.functional 中的类) generate() (torchrl.data.RolloutFromModel 方法) generate_exp_name() (在 torchrl.record.loggers 模块中) get() (torchrl.data.CompositeSpec 方法) (torchrl.data.LazyStackedCompositeSpec 方法) (torchrl.data.PairwiseDataset 方法) (torchrl.data.PromptData 方法) (torchrl.data.RewardData 方法) get_available_libraries() (在 torchrl.envs.utils 模块中) get_buffer() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) get_class_that_defined_method() (torchrl._utils.implement_for 静态方法) get_critic_operator() (torchrl.modules.tensordict_module.ActorCriticOperator 方法) get_dataloader (torchrl.data 中的类) get_extra_state() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) (torchrl.envs.transforms.VecNorm 方法) get_insert_index() (torchrl.data.replay_buffers.TensorDictMaxValueWriter 方法) get_logger() (在 torchrl.record.loggers 模块中) get_mode() (torchrl.modules.TanhNormal 方法) get_parameter() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) get_policy_head() (torchrl.modules.tensordict_module.ActorCriticOperator 方法) (torchrl.modules.tensordict_module.ActorCriticWrapper 方法) (torchrl.modules.tensordict_module.ActorValueOperator 方法) get_policy_operator() (torchrl.modules.tensordict_module.ActorCriticWrapper 方法) (torchrl.modules.tensordict_module.ActorValueOperator 方法) get_primers_from_module (torchrl.modules.utils 中的类) get_reward_operator() (torchrl.modules.tensordict_module.WorldModelWrapper 方法) get_stateful_net() (torchrl.modules.MultiAgentNetBase 方法) (torchrl.objectives.LossModule 方法) get_stats_random_rollout() (在 torchrl.trainers.helpers 模块中) get_submodule() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) get_transition_model_operator() (torchrl.modules.tensordict_module.WorldModelWrapper 方法) get_value_head() (torchrl.modules.tensordict_module.ActorCriticOperator 方法) (torchrl.modules.tensordict_module.ActorCriticWrapper 方法) (torchrl.modules.tensordict_module.ActorValueOperator 方法) get_value_operator() (torchrl.modules.tensordict_module.ActorCriticOperator 方法) (torchrl.modules.tensordict_module.ActorCriticWrapper 方法) (torchrl.modules.tensordict_module.ActorValueOperator 方法) GrayScale (torchrl.envs.transforms 中的类) GRU (torchrl.modules 中的类) GRUCell (torchrl.modules 中的类) GRUModule (torchrl.modules 中的类) gSDENoise (torchrl.envs.transforms 中的类) gym_backend() (在 torchrl.envs 模块中) GymEnv() (在 torchrl.envs 模块中) GymLikeEnv (torchrl.envs 中的类) GymWrapper() (在 torchrl.envs 模块中) H H5Combine (torchrl.data 中的类) H5Split (torchrl.data 中的类) H5StorageCheckpointer (torchrl.data.replay_buffers 中的类) HabitatEnv() (在 torchrl.envs 模块中) half() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) HardUpdate (torchrl.objectives 中的类) hold_out_net (torchrl.objectives 中的类) hold_out_params (torchrl.objectives 中的类) I ImmutableDatasetWriter (torchrl.data.replay_buffers 中的类) implement_for (torchrl._utils 中的类) implements_for_spec() (torchrl.data.BinaryDiscreteTensorSpec 类方法) (torchrl.data.BoundedTensorSpec 类方法) (torchrl.data.CompositeSpec 类方法) (torchrl.data.DiscreteTensorSpec 类方法) (torchrl.data.LazyStackedCompositeSpec 类方法) (torchrl.data.LazyStackedTensorSpec 类方法) (torchrl.data.MultiDiscreteTensorSpec 类方法) (torchrl.data.MultiOneHotDiscreteTensorSpec 类方法) (torchrl.data.NonTensorSpec 类方法) (torchrl.data.OneHotDiscreteTensorSpec 类方法) (torchrl.data.TensorSpec 类方法) (torchrl.data.UnboundedContinuousTensorSpec 类方法) (torchrl.data.UnboundedDiscreteTensorSpec 类方法) import_module() (torchrl._utils.implement_for 类方法) IndependentNormal (torchrl.modules 中的类) index() (torchrl.data.BinaryDiscreteTensorSpec 方法) (torchrl.data.BoundedTensorSpec 方法) (torchrl.data.CompositeSpec 方法) (torchrl.data.DiscreteTensorSpec 方法) (torchrl.data.LazyStackedCompositeSpec 方法) (torchrl.data.LazyStackedTensorSpec 方法) (torchrl.data.MultiDiscreteTensorSpec 方法) (torchrl.data.MultiOneHotDiscreteTensorSpec 方法) (torchrl.data.NonTensorSpec 方法) (torchrl.data.OneHotDiscreteTensorSpec 方法) (torchrl.data.TensorSpec 方法) (torchrl.data.UnboundedContinuousTensorSpec 方法) (torchrl.data.UnboundedDiscreteTensorSpec 方法) init_key (torchrl.modules.tensordict_module.MultiStepActorWrapper 属性) init_stats() (torchrl.envs.transforms.ObservationNorm 方法) initialize_parameters() (torchrl.modules.NoisyLazyLinear 方法) InitTracker (torchrl.envs.transforms 中的类) input_spec (torchrl.envs.EnvBase 属性) (torchrl.envs.GymLikeEnv 属性) (torchrl.envs.ParallelEnv 属性) (torchrl.envs.PendulumEnv 属性) (torchrl.envs.SerialEnv 属性) (torchrl.envs.TicTacToeEnv 属性) (torchrl.envs.transforms.TransformedEnv 属性) insert() (torchrl.envs.transforms.Compose 方法) insert_transform() (torchrl.data.datasets.AtariDQNExperienceReplay 方法) (torchrl.data.datasets.BaseDatasetExperienceReplay 方法) (torchrl.data.datasets.D4RLExperienceReplay 方法) (torchrl.data.datasets.GenDGRLExperienceReplay 方法) (torchrl.data.datasets.MinariExperienceReplay 方法) (torchrl.data.datasets.OpenMLExperienceReplay 方法) (torchrl.data.datasets.OpenXExperienceReplay 方法) (torchrl.data.datasets.RobosetExperienceReplay 方法) (torchrl.data.datasets.VD4RLExperienceReplay 方法) (torchrl.data.PrioritizedReplayBuffer 方法) (torchrl.data.replay_buffers.ReplayBufferEnsemble 方法) (torchrl.data.ReplayBuffer 方法) (torchrl.data.TensorDictPrioritizedReplayBuffer 方法) (torchrl.data.TensorDictReplayBuffer 方法) (torchrl.envs.transforms.AutoResetEnv 方法) (torchrl.envs.transforms.TransformedEnv 方法) inv_softplus (torchrl.modules.utils 中的类) ipu() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) IQLLoss (torchrl.objectives 中的类) is_empty() (torchrl.data.CompositeSpec 方法) (torchrl.data.LazyStackedCompositeSpec 方法) is_in() (torchrl.data.BinaryDiscreteTensorSpec 方法) (torchrl.data.BoundedTensorSpec 方法) (torchrl.data.CompositeSpec 方法) (torchrl.data.DiscreteTensorSpec 方法) (torchrl.data.LazyStackedCompositeSpec 方法) (torchrl.data.LazyStackedTensorSpec 方法) (torchrl.data.MultiDiscreteTensorSpec 方法) (torchrl.data.MultiOneHotDiscreteTensorSpec 方法) (torchrl.data.NonTensorSpec 方法) (torchrl.data.OneHotDiscreteTensorSpec 方法) (torchrl.data.TensorSpec 方法) (torchrl.data.UnboundedContinuousTensorSpec 方法) (torchrl.data.UnboundedDiscreteTensorSpec 方法) IsaacGymEnv() (在 torchrl.envs 模块中) IsaacGymWrapper() (在 torchrl.envs 模块中) items() (torchrl.data.CompositeSpec 方法) (torchrl.data.LazyStackedCompositeSpec 方法) iterator() (torchrl.collectors.SyncDataCollector 方法) J JumanjiEnv() (在 torchrl.envs 模块中) JumanjiWrapper() (在 torchrl.envs 模块中) K keys() (torchrl.data.CompositeSpec 方法) (torchrl.data.LazyStackedCompositeSpec 方法) KLPENPPOLoss (torchrl.objectives 中的类) KLRewardTransform (torchrl.envs.transforms 中的类) L LazyMemmapStorage (torchrl.data.replay_buffers 中的类) LazyStackedCompositeSpec (torchrl.data 中的类) LazyStackedTensorSpec (torchrl.data 中的类) LazyTensorStorage (torchrl.data.replay_buffers 中的类) ListStorage (torchrl.data.replay_buffers 中的类) ListStorageCheckpointer (torchrl.data.replay_buffers 中的类) LMHeadActorValueOperator (torchrl.modules.tensordict_module 中的类) load() (torchrl.data.datasets.AtariDQNExperienceReplay 方法) (torchrl.data.datasets.BaseDatasetExperienceReplay 方法) (torchrl.data.datasets.D4RLExperienceReplay 方法) (torchrl.data.datasets.GenDGRLExperienceReplay 方法) (torchrl.data.datasets.MinariExperienceReplay 方法) (torchrl.data.datasets.OpenMLExperienceReplay 方法) (torchrl.data.datasets.OpenXExperienceReplay 方法) (torchrl.data.datasets.RobosetExperienceReplay 方法) (torchrl.data.datasets.VD4RLExperienceReplay 方法) (torchrl.data.PairwiseDataset 类方法) (torchrl.data.PrioritizedReplayBuffer 方法) (torchrl.data.PromptData 类方法) (torchrl.data.replay_buffers.LazyMemmapStorage 方法) (torchrl.data.replay_buffers.LazyTensorStorage 方法) (torchrl.data.replay_buffers.ListStorage 方法) (torchrl.data.replay_buffers.ReplayBufferEnsemble 方法) (torchrl.data.replay_buffers.Storage 方法) (torchrl.data.replay_buffers.StorageEnsemble 方法) (torchrl.data.replay_buffers.TensorStorage 方法) (torchrl.data.ReplayBuffer 方法) (torchrl.data.RewardData 类方法) (torchrl.data.TensorDictPrioritizedReplayBuffer 方法) (torchrl.data.TensorDictReplayBuffer 方法) (torchrl.data.TokenizedDatasetLoader 方法) load_() (torchrl.data.PairwiseDataset 方法) (torchrl.data.PromptData 方法) (torchrl.data.RewardData 方法) load_memmap() (torchrl.data.PairwiseDataset 类方法) (torchrl.data.PromptData 类方法) (torchrl.data.RewardData 类方法) load_state_dict() (torchrl.collectors.aSyncDataCollector 方法) (torchrl.collectors.distributed.RayCollector 方法) (torchrl.collectors.MultiaSyncDataCollector 方法) (torchrl.collectors.MultiSyncDataCollector 方法) (torchrl.collectors.SyncDataCollector 方法) (torchrl.data.MultiStep 方法) (torchrl.data.PairwiseDataset 方法) (torchrl.data.PromptData 方法) (torchrl.data.RewardData 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) (torchrl.envs.transforms.TransformedEnv 方法) (torchrl.objectives.SACLoss 方法) loads() (torchrl.data.datasets.AtariDQNExperienceReplay 方法) (torchrl.data.datasets.BaseDatasetExperienceReplay 方法) (torchrl.data.datasets.D4RLExperienceReplay 方法) (torchrl.data.datasets.GenDGRLExperienceReplay 方法) (torchrl.data.datasets.MinariExperienceReplay 方法) (torchrl.data.datasets.OpenMLExperienceReplay 方法) (torchrl.data.datasets.OpenXExperienceReplay 方法) (torchrl.data.datasets.RobosetExperienceReplay 方法) (torchrl.data.datasets.VD4RLExperienceReplay 方法) (torchrl.data.PrioritizedReplayBuffer 方法) (torchrl.data.replay_buffers.ReplayBufferEnsemble 方法) (torchrl.data.ReplayBuffer 方法) (torchrl.data.TensorDictPrioritizedReplayBuffer 方法) (torchrl.data.TensorDictReplayBuffer 方法) loc (torchrl.envs.transforms.VecNorm 属性) local_policy() (torchrl.collectors.distributed.RayCollector 方法) lock_() (torchrl.data.CompositeSpec 方法) (torchrl.data.LazyStackedCompositeSpec 方法) log_prob() (torchrl.modules.Delta 方法) (torchrl.modules.MaskedCategorical 方法) (torchrl.modules.MaskedOneHotCategorical 方法) (torchrl.modules.OneHotCategorical 方法) (torchrl.modules.TruncatedNormal 方法) Logger() (在 torchrl.record.loggers 模块中) logprobs_of_labels() (torchrl.data.RolloutFromModel 静态方法) LogReward (torchrl.trainers 中的类) loss_value_diff() (torchrl.objectives.IQLLoss 静态方法) LossModule (torchrl.objectives 中的类) LSTM (torchrl.modules 中的类) LSTMCell (torchrl.modules 中的类) LSTMModule (torchrl.modules 中的类) M make_collector_offpolicy() (在 torchrl.trainers.helpers 模块中) make_collector_onpolicy() (在 torchrl.trainers.helpers 模块中) make_composite_from_td() (在 torchrl.envs.utils 模块中) make_dqn_loss() (在 torchrl.trainers.helpers 模块中) make_noload_model() (torchrl.envs.transforms.VC1Transform 类方法) make_replay_buffer() (在 torchrl.trainers.helpers 模块中) make_target_updater() (在 torchrl.trainers.helpers 模块中) make_tensordict_primer() (torchrl.modules.GRUModule 方法), [1] (torchrl.modules.LSTMModule 方法), [1] make_trainer() (在 torchrl.trainers.helpers 模块中) make_value_estimator() (torchrl.objectives.A2CLoss 方法) (torchrl.objectives.CQLLoss 方法) (torchrl.objectives.DDPGLoss 方法) (torchrl.objectives.DiscreteCQLLoss 方法) (torchrl.objectives.DiscreteSACLoss 方法) (torchrl.objectives.DistributionalDQNLoss 方法) (torchrl.objectives.DQNLoss 方法) (torchrl.objectives.DreamerActorLoss 方法) (torchrl.objectives.IQLLoss 方法) (torchrl.objectives.LossModule 方法) (torchrl.objectives.multiagent.QMixerLoss 方法) (torchrl.objectives.PPOLoss 方法) (torchrl.objectives.REDQLoss 方法) (torchrl.objectives.ReinforceLoss 方法) (torchrl.objectives.SACLoss 方法) (torchrl.objectives.TD3BCLoss 方法) (torchrl.objectives.TD3Loss 方法) mappings (torchrl.modules.utils 中的类) MarlGroupMapType() (在 torchrl.envs 模块中) mask_context() (torchrl.modules.tensordict_module.DecisionTransformerInferenceWrapper 方法) MaskedCategorical (torchrl.modules 中的类) MaskedOneHotCategorical (torchrl.modules 中的类) maybe_reset() (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) mean (torchrl.modules.Delta 属性) (torchrl.modules.TanhDelta 属性) (torchrl.modules.TanhNormal 属性) MeltingpotEnv() (在 torchrl.envs 模块中) MeltingpotWrapper() (在 torchrl.envs 模块中) memmap() (torchrl.data.PairwiseDataset 方法) (torchrl.data.PromptData 方法) (torchrl.data.RewardData 方法) memmap_() (torchrl.data.PairwiseDataset 方法) (torchrl.data.PromptData 方法) (torchrl.data.RewardData 方法) memmap_like() (torchrl.data.PairwiseDataset 方法) (torchrl.data.PromptData 方法) (torchrl.data.RewardData 方法) memmap_refresh_() (torchrl.data.PairwiseDataset 方法) (torchrl.data.PromptData 方法) (torchrl.data.RewardData 方法) MinariExperienceReplay (torchrl.data.datasets 中的类) mix() (torchrl.modules.QMixer 方法) (torchrl.modules.VDNMixer 方法) MLFlowLogger() (在 torchrl.record.loggers.mlflow 模块中) MLP (torchrl.modules 中的类) mode (torchrl.modules.Delta 属性) (torchrl.modules.IndependentNormal 属性) (torchrl.modules.OneHotCategorical 属性) (torchrl.modules.TanhDelta 属性) (torchrl.modules.TanhNormal 属性) (torchrl.modules.TruncatedNormal 属性) ModelBasedEnvBase() (在 torchrl.envs 模块中) module_set() (torchrl._utils.implement_for 方法) modules() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) MOGymEnv() (在 torchrl.envs 模块中) MOGymWrapper() (在 torchrl.envs 模块中) MPCPlannerBase (torchrl.modules 中的类) MPPIPlanner (torchrl.modules 中的类) mtia() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) MultiAgentConvNet (torchrl.modules 中的类) MultiAgentMLP (torchrl.modules 中的类) MultiAgentNetBase (torchrl.modules 中的类) MultiaSyncDataCollector (torchrl.collectors 中的类) MultiDiscreteTensorSpec (torchrl.data 中的类) MultiOneHotDiscreteTensorSpec (torchrl.data 中的类) MultiStep (torchrl.data 中的类) MultiStepActorWrapper (torchrl.modules.tensordict_module 中的类) MultiStepTransform (torchrl.envs.transforms.rb_transforms 中的类) MultiSyncDataCollector (torchrl.collectors 中的类) MultiThreadedEnv() (在 torchrl.envs 模块中) MultiThreadedEnvWrapper() (在 torchrl.envs 模块中) N n_steps (torchrl.envs.transforms.rb_transforms.MultiStepTransform 属性) named_buffers() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) named_children() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) named_modules() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) named_parameters() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) (torchrl.objectives.LossModule 方法) names (torchrl.data.PairwiseDataset 属性) (torchrl.data.PromptData 属性) (torchrl.data.RewardData 属性) Nested2TED (torchrl.data 中的类) NestedStorageCheckpointer (torchrl.data.replay_buffers 中的类) next_state_value (torchrl.objectives 中的类) NoisyLazyLinear (torchrl.modules 中的类) NoisyLinear (torchrl.modules 中的类) NonTensorSpec (torchrl.data 中的类) NoopResetEnv (torchrl.envs.transforms 中的类) NormalParamWrapper (torchrl.modules 中的类) O ObsDecoder (torchrl.modules 中的类) ObsEncoder (torchrl.modules 中的类) observation_spec (torchrl.envs.EnvBase 属性) (torchrl.envs.GymLikeEnv 属性) (torchrl.envs.ParallelEnv 属性) (torchrl.envs.PendulumEnv 属性) (torchrl.envs.SerialEnv 属性) (torchrl.envs.TicTacToeEnv 属性) ObservationNorm (torchrl.envs.transforms 中的类) ObservationTransform (torchrl.envs.transforms 中的类) OneHotCategorical (torchrl.modules 中的类) OneHotDiscreteTensorSpec (torchrl.data 中的类) OnlineDTActor (torchrl.modules 中的类) OnlineDTLoss (torchrl.objectives 中的类) OpenMLEnv() (在 torchrl.envs 模块中) OpenMLExperienceReplay (torchrl.data.datasets 中的类) OpenXExperienceReplay (torchrl.data.datasets 中的类) OptimizerHook (torchrl.trainers 中的类) OrnsteinUhlenbeckProcessModule (torchrl.modules.tensordict_module 中的类) OrnsteinUhlenbeckProcessWrapper (torchrl.modules.tensordict_module 中的类) output_spec (torchrl.envs.EnvBase 属性) (torchrl.envs.GymLikeEnv 属性) (torchrl.envs.ParallelEnv 属性) (torchrl.envs.PendulumEnv 属性) (torchrl.envs.SerialEnv 属性) (torchrl.envs.TicTacToeEnv 属性) (torchrl.envs.transforms.TransformedEnv 属性) P PairwiseDataset (torchrl.data 中的类) parallel_env_constructor() (在 torchrl.trainers.helpers 模块中) ParallelEnv (torchrl.envs 中的类) parameters() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) (torchrl.objectives.LossModule 方法) parent (torchrl.envs.transforms.rb_transforms.MultiStepTransform 属性) (torchrl.envs.transforms.Transform 属性) PendulumEnv (torchrl.envs 中的类) PermuteTransform (torchrl.envs.transforms 中的类) PettingZooEnv() (在 torchrl.envs 模块中) PettingZooWrapper() (在 torchrl.envs 模块中) PinMemoryTransform (torchrl.envs.transforms 中的类) PixelRenderTransform() (在 torchrl.record 模块中) planning() (torchrl.modules.CEMPlanner 方法) (torchrl.modules.MPCPlannerBase 方法) (torchrl.modules.MPPIPlanner 方法) PPOLoss (torchrl.objectives 中的类) preprocess() (torchrl.data.datasets.AtariDQNExperienceReplay 方法) (torchrl.data.datasets.BaseDatasetExperienceReplay 方法) (torchrl.data.datasets.D4RLExperienceReplay 方法) (torchrl.data.datasets.GenDGRLExperienceReplay 方法) (torchrl.data.datasets.MinariExperienceReplay 方法) (torchrl.data.datasets.OpenMLExperienceReplay 方法) (torchrl.data.datasets.OpenXExperienceReplay 方法) (torchrl.data.datasets.RobosetExperienceReplay 方法) (torchrl.data.datasets.VD4RLExperienceReplay 方法) PrioritizedReplayBuffer (torchrl.data 中的类) PrioritizedSampler (torchrl.data.replay_buffers 中的类) PrioritizedSliceSampler (torchrl.data.replay_buffers 中的类) ProbabilisticActor (torchrl.modules.tensordict_module 中的类) project() (torchrl.data.BinaryDiscreteTensorSpec 方法) (torchrl.data.BoundedTensorSpec 方法) (torchrl.data.CompositeSpec 方法) (torchrl.data.DiscreteTensorSpec 方法) (torchrl.data.LazyStackedCompositeSpec 方法) (torchrl.data.LazyStackedTensorSpec 方法) (torchrl.data.MultiDiscreteTensorSpec 方法) (torchrl.data.MultiOneHotDiscreteTensorSpec 方法) (torchrl.data.NonTensorSpec 方法) (torchrl.data.OneHotDiscreteTensorSpec 方法) (torchrl.data.TensorSpec 方法) (torchrl.data.UnboundedContinuousTensorSpec 方法) (torchrl.data.UnboundedDiscreteTensorSpec 方法) PromptData (torchrl.data 中的类) PromptTensorDictTokenizer (torchrl.data 中的类) Q QMixer (torchrl.modules 中的类) QMixerLoss (torchrl.objectives.multiagent 中的类) qvalue_loss() (torchrl.objectives.TD3BCLoss 方法) QValueActor (torchrl.modules.tensordict_module 中的类) QValueHook (torchrl.modules 中的类) QValueModule (torchrl.modules.tensordict_module 中的类) R R3MTransform (torchrl.envs.transforms 中的类) rand() (torchrl.data.BinaryDiscreteTensorSpec 方法) (torchrl.data.BoundedTensorSpec 方法) (torchrl.data.CompositeSpec 方法) (torchrl.data.DiscreteTensorSpec 方法) (torchrl.data.LazyStackedCompositeSpec 方法) (torchrl.data.LazyStackedTensorSpec 方法) (torchrl.data.MultiDiscreteTensorSpec 方法) (torchrl.data.MultiOneHotDiscreteTensorSpec 方法) (torchrl.data.NonTensorSpec 方法) (torchrl.data.OneHotDiscreteTensorSpec 方法) (torchrl.data.TensorSpec 方法) (torchrl.data.UnboundedContinuousTensorSpec 方法) (torchrl.data.UnboundedDiscreteTensorSpec 方法) rand_action() (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) rand_step() (在 torchrl.envs 模块中) (torchrl.envs.EnvBase 方法), [1] (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) random() (torchrl.modules.tensordict_module.SafeModule 方法) (torchrl.modules.tensordict_module.SafeProbabilisticModule 方法) random_sample() (torchrl.modules.tensordict_module.SafeModule 方法) (torchrl.modules.tensordict_module.SafeProbabilisticModule 方法) RandomCropTensorDict (torchrl.envs.transforms 中的类) RandomPolicy() (在 torchrl.envs.utils 模块中) RandomSampler (torchrl.data.replay_buffers 中的类) RayCollector (torchrl.collectors.distributed 中的类) read_action() (torchrl.envs.GymLikeEnv 方法) read_done() (torchrl.envs.GymLikeEnv 方法) read_obs() (torchrl.envs.GymLikeEnv 方法) read_reward() (torchrl.envs.GymLikeEnv 方法) Recorder (torchrl.trainers 中的类) REDQLoss (torchrl.objectives 中的类) register() (torchrl.trainers.BatchSubSampler 方法) (torchrl.trainers.ClearCudaCache 方法) (torchrl.trainers.CountFramesLog 方法) (torchrl.trainers.LogReward 方法) (torchrl.trainers.OptimizerHook 方法) (torchrl.trainers.Recorder 方法) (torchrl.trainers.ReplayBufferTrainer 方法) (torchrl.trainers.RewardNormalizer 方法) (torchrl.trainers.SelectKeys 方法) (torchrl.trainers.TrainerHookBase 方法) (torchrl.trainers.UpdateWeights 方法) register_backward_hook() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) register_buffer() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) register_forward_hook() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) register_forward_pre_hook() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) register_full_backward_hook() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) register_full_backward_pre_hook() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) register_gym() (torchrl.envs.EnvBase 类方法) (torchrl.envs.GymLikeEnv 类方法) (torchrl.envs.ParallelEnv 类方法) (torchrl.envs.PendulumEnv 类方法) (torchrl.envs.SerialEnv 类方法) (torchrl.envs.TicTacToeEnv 类方法) register_keys() (torchrl.envs.transforms.EndOfLifeTransform 方法) register_load_hook() (torchrl.data.datasets.AtariDQNExperienceReplay 方法) (torchrl.data.datasets.BaseDatasetExperienceReplay 方法) (torchrl.data.datasets.D4RLExperienceReplay 方法) (torchrl.data.datasets.GenDGRLExperienceReplay 方法) (torchrl.data.datasets.MinariExperienceReplay 方法) (torchrl.data.datasets.OpenMLExperienceReplay 方法) (torchrl.data.datasets.OpenXExperienceReplay 方法) (torchrl.data.datasets.RobosetExperienceReplay 方法) (torchrl.data.datasets.VD4RLExperienceReplay 方法) (torchrl.data.PrioritizedReplayBuffer 方法) (torchrl.data.replay_buffers.ReplayBufferEnsemble 方法) (torchrl.data.ReplayBuffer 方法) (torchrl.data.TensorDictPrioritizedReplayBuffer 方法) (torchrl.data.TensorDictReplayBuffer 方法) register_load_state_dict_post_hook() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) register_load_state_dict_pre_hook() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) register_module() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) register_parameter() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) register_save_hook() (torchrl.data.datasets.AtariDQNExperienceReplay 方法) (torchrl.data.datasets.BaseDatasetExperienceReplay 方法) (torchrl.data.datasets.D4RLExperienceReplay 方法) (torchrl.data.datasets.GenDGRLExperienceReplay 方法) (torchrl.data.datasets.MinariExperienceReplay 方法) (torchrl.data.datasets.OpenMLExperienceReplay 方法) (torchrl.data.datasets.OpenXExperienceReplay 方法) (torchrl.data.datasets.RobosetExperienceReplay 方法) (torchrl.data.datasets.VD4RLExperienceReplay 方法) (torchrl.data.PrioritizedReplayBuffer 方法) (torchrl.data.replay_buffers.ReplayBufferEnsemble 方法) (torchrl.data.ReplayBuffer 方法) (torchrl.data.TensorDictPrioritizedReplayBuffer 方法) (torchrl.data.TensorDictReplayBuffer 方法) register_state_dict_post_hook() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) register_state_dict_pre_hook() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) ReinforceLoss (torchrl.objectives 中的类) remote_collectors() (torchrl.collectors.distributed.RayCollector 方法) RemoveEmptySpecs (torchrl.envs.transforms 中的类) RenameTransform (torchrl.envs.transforms 中的类) ReplayBuffer (torchrl.data 中的类) ReplayBufferEnsemble (torchrl.data.replay_buffers 中的类) ReplayBufferTrainer (torchrl.trainers 中的类) requires_grad_() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) reset() (在 torchrl.envs 模块中) (torchrl._utils.implement_for 类方法) (torchrl.collectors.aSyncDataCollector 方法) (torchrl.collectors.MultiaSyncDataCollector 方法) (torchrl.collectors.MultiSyncDataCollector 方法) (torchrl.collectors.SyncDataCollector 方法) (torchrl.envs.EnvBase 方法), [1] (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) reset_keys (torchrl.envs.EnvBase 属性) (torchrl.envs.GymLikeEnv 属性) (torchrl.envs.ParallelEnv 属性) (torchrl.envs.PendulumEnv 属性) (torchrl.envs.SerialEnv 属性) (torchrl.envs.TicTacToeEnv 属性) reset_noise (torchrl.modules 中的类) reset_parameters() (torchrl.modules.MultiAgentNetBase 方法) reshape() (torchrl.data.BinaryDiscreteTensorSpec 方法) (torchrl.data.BoundedTensorSpec 方法) (torchrl.data.CompositeSpec 方法) (torchrl.data.DiscreteTensorSpec 方法) (torchrl.data.LazyStackedCompositeSpec 方法) (torchrl.data.LazyStackedTensorSpec 方法) (torchrl.data.MultiDiscreteTensorSpec 方法) (torchrl.data.MultiOneHotDiscreteTensorSpec 方法) (torchrl.data.NonTensorSpec 方法) (torchrl.data.OneHotDiscreteTensorSpec 方法) (torchrl.data.TensorSpec 方法) (torchrl.data.UnboundedContinuousTensorSpec 方法) (torchrl.data.UnboundedDiscreteTensorSpec 方法) Resize (torchrl.envs.transforms 中的类) reward2go (torchrl.objectives.value.functional 中的类) Reward2GoTransform (torchrl.envs.transforms 中的类) reward_key (torchrl.envs.EnvBase 属性) (torchrl.envs.GymLikeEnv 属性) (torchrl.envs.ParallelEnv 属性) (torchrl.envs.PendulumEnv 属性) (torchrl.envs.SerialEnv 属性) (torchrl.envs.TicTacToeEnv 属性) reward_keys (torchrl.envs.EnvBase 属性) (torchrl.envs.GymLikeEnv 属性) (torchrl.envs.ParallelEnv 属性) (torchrl.envs.PendulumEnv 属性) (torchrl.envs.SerialEnv 属性) (torchrl.envs.TicTacToeEnv 属性) reward_spec (torchrl.envs.EnvBase 属性) (torchrl.envs.GymLikeEnv 属性) (torchrl.envs.ParallelEnv 属性) (torchrl.envs.PendulumEnv 属性) (torchrl.envs.SerialEnv 属性) (torchrl.envs.TicTacToeEnv 属性) RewardClipping (torchrl.envs.transforms 中的类) RewardData (torchrl.data 中的类) RewardNormalizer (torchrl.trainers 中的类) RewardScaling (torchrl.envs.transforms 中的类) RewardSum (torchrl.envs.transforms 中的类) RoboHiveEnv() (在 torchrl.envs 模块中) RobosetExperienceReplay (torchrl.data.datasets 中的类) rollout() (在 torchrl.envs 模块中) (torchrl.collectors.SyncDataCollector 方法) (torchrl.envs.EnvBase 方法), [1] (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) RolloutFromModel (torchrl.data 中的类) RoundRobinWriter (torchrl.data.replay_buffers 中的类) RPCDataCollector (torchrl.collectors.distributed 中的类) rsample() (torchrl.modules.Delta 方法) (torchrl.modules.MaskedOneHotCategorical 方法) (torchrl.modules.OneHotCategorical 方法) RSSMPosterior (torchrl.modules 中的类) RSSMPrior (torchrl.modules 中的类) S SACLoss (torchrl.objectives 中的类) SafeModule (torchrl.modules.tensordict_module 中的类) SafeProbabilisticModule (torchrl.modules.tensordict_module 中的类) SafeProbabilisticTensorDictSequential (torchrl.modules.tensordict_module 中的类) SafeSequential (torchrl.modules.tensordict_module 中的类) sample (torchrl.data.BinaryDiscreteTensorSpec 属性) (torchrl.data.BoundedTensorSpec 属性) (torchrl.data.CompositeSpec 属性) (torchrl.data.DiscreteTensorSpec 属性) (torchrl.data.LazyStackedCompositeSpec 属性) (torchrl.data.LazyStackedTensorSpec 属性) (torchrl.data.MultiDiscreteTensorSpec 属性) (torchrl.data.MultiOneHotDiscreteTensorSpec 属性) (torchrl.data.NonTensorSpec 属性) (torchrl.data.OneHotDiscreteTensorSpec 属性) (torchrl.data.TensorSpec 属性) (torchrl.data.UnboundedContinuousTensorSpec 属性) (torchrl.data.UnboundedDiscreteTensorSpec 属性) sample() (torchrl.data.datasets.AtariDQNExperienceReplay 方法) (torchrl.data.datasets.BaseDatasetExperienceReplay 方法) (torchrl.data.datasets.D4RLExperienceReplay 方法) (torchrl.data.datasets.GenDGRLExperienceReplay 方法) (torchrl.data.datasets.MinariExperienceReplay 方法) (torchrl.data.datasets.OpenMLExperienceReplay 方法) (torchrl.data.datasets.OpenXExperienceReplay 方法) (torchrl.data.datasets.RobosetExperienceReplay 方法) (torchrl.data.datasets.VD4RLExperienceReplay 方法) (torchrl.data.PrioritizedReplayBuffer 方法) (torchrl.data.replay_buffers.ReplayBufferEnsemble 方法) (torchrl.data.ReplayBuffer 方法) (torchrl.data.TensorDictPrioritizedReplayBuffer 方法) (torchrl.data.TensorDictReplayBuffer 方法) (torchrl.modules.Delta 方法) (torchrl.modules.MaskedCategorical 方法) (torchrl.modules.MaskedOneHotCategorical 方法) (torchrl.modules.OneHotCategorical 方法) Sampler (torchrl.data.replay_buffers 中的类) sampler (torchrl.data.datasets.AtariDQNExperienceReplay 属性) (torchrl.data.datasets.BaseDatasetExperienceReplay 属性) (torchrl.data.datasets.D4RLExperienceReplay 属性) (torchrl.data.datasets.GenDGRLExperienceReplay 属性) (torchrl.data.datasets.MinariExperienceReplay 属性) (torchrl.data.datasets.OpenMLExperienceReplay 属性) (torchrl.data.datasets.OpenXExperienceReplay 属性) (torchrl.data.datasets.RobosetExperienceReplay 属性) (torchrl.data.datasets.VD4RLExperienceReplay 属性) (torchrl.data.PrioritizedReplayBuffer 属性) (torchrl.data.replay_buffers.ReplayBufferEnsemble 属性) (torchrl.data.ReplayBuffer 属性) (torchrl.data.TensorDictPrioritizedReplayBuffer 属性) (torchrl.data.TensorDictReplayBuffer 属性) SamplerEnsemble (torchrl.data.replay_buffers 中的类) SamplerWithoutReplacement (torchrl.data.replay_buffers 中的类) save() (torchrl.data.datasets.AtariDQNExperienceReplay 方法) (torchrl.data.datasets.BaseDatasetExperienceReplay 方法) (torchrl.data.datasets.D4RLExperienceReplay 方法) (torchrl.data.datasets.GenDGRLExperienceReplay 方法) (torchrl.data.datasets.MinariExperienceReplay 方法) (torchrl.data.datasets.OpenMLExperienceReplay 方法) (torchrl.data.datasets.OpenXExperienceReplay 方法) (torchrl.data.datasets.RobosetExperienceReplay 方法) (torchrl.data.datasets.VD4RLExperienceReplay 方法) (torchrl.data.PairwiseDataset 方法) (torchrl.data.PrioritizedReplayBuffer 方法) (torchrl.data.PromptData 方法) (torchrl.data.replay_buffers.LazyMemmapStorage 方法) (torchrl.data.replay_buffers.LazyTensorStorage 方法) (torchrl.data.replay_buffers.ListStorage 方法) (torchrl.data.replay_buffers.ReplayBufferEnsemble 方法) (torchrl.data.replay_buffers.Storage 方法) (torchrl.data.replay_buffers.StorageEnsemble 方法) (torchrl.data.replay_buffers.TensorStorage 方法) (torchrl.data.ReplayBuffer 方法) (torchrl.data.RewardData 方法) (torchrl.data.TensorDictPrioritizedReplayBuffer 方法) (torchrl.data.TensorDictReplayBuffer 方法) scale (torchrl.envs.transforms.VecNorm 属性) SelectKeys (torchrl.trainers 中的类) SelectTransform (torchrl.envs.transforms 中的类) SerialEnv (torchrl.envs 中的类) set() (torchrl.data.PairwiseDataset 方法) (torchrl.data.PromptData 方法) (torchrl.data.RewardData 方法) set_exploration_mode() (在 torchrl.envs.utils 模块中) set_exploration_type() (在 torchrl.envs.utils 模块中) set_extra_state() (torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) (torchrl.envs.transforms.VecNorm 方法) set_gym_backend() (在 torchrl.envs 模块中) set_info_dict_reader() (torchrl.envs.GymLikeEnv 方法) set_keys()(torchrl.objectives.LossModule 方法) (torchrl.objectives.value.ValueEstimatorBase 方法) set_missing_tolerance()(torchrl.envs.transforms.TransformedEnv 方法) set_recurrent_mode()(torchrl.modules.GRUModule 方法),[1] (torchrl.modules.LSTMModule 方法),[1] set_sampler()(torchrl.data.datasets.AtariDQNExperienceReplay 方法) (torchrl.data.datasets.BaseDatasetExperienceReplay 方法) (torchrl.data.datasets.D4RLExperienceReplay 方法) (torchrl.data.datasets.GenDGRLExperienceReplay 方法) (torchrl.data.datasets.MinariExperienceReplay 方法) (torchrl.data.datasets.OpenMLExperienceReplay 方法) (torchrl.data.datasets.OpenXExperienceReplay 方法) (torchrl.data.datasets.RobosetExperienceReplay 方法) (torchrl.data.datasets.VD4RLExperienceReplay 方法) (torchrl.data.PrioritizedReplayBuffer 方法) (torchrl.data.replay_buffers.ReplayBufferEnsemble 方法) (torchrl.data.ReplayBuffer 方法) (torchrl.data.TensorDictPrioritizedReplayBuffer 方法) (torchrl.data.TensorDictReplayBuffer 方法) set_seed()(在模块 torchrl.envs 中) (torchrl.collectors.aSyncDataCollector 方法) (torchrl.collectors.distributed.RayCollector 方法) (torchrl.collectors.MultiaSyncDataCollector 方法) (torchrl.collectors.MultiSyncDataCollector 方法) (torchrl.collectors.SyncDataCollector 方法) (torchrl.envs.EnvBase 方法),[1] (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.TransformedEnv 方法) set_storage()(torchrl.data.datasets.AtariDQNExperienceReplay 方法) (torchrl.data.datasets.BaseDatasetExperienceReplay 方法) (torchrl.data.datasets.D4RLExperienceReplay 方法) (torchrl.data.datasets.GenDGRLExperienceReplay 方法) (torchrl.data.datasets.MinariExperienceReplay 方法) (torchrl.data.datasets.OpenMLExperienceReplay 方法) (torchrl.data.datasets.OpenXExperienceReplay 方法) (torchrl.data.datasets.RobosetExperienceReplay 方法) (torchrl.data.datasets.VD4RLExperienceReplay 方法) (torchrl.data.PrioritizedReplayBuffer 方法) (torchrl.data.replay_buffers.ReplayBufferEnsemble 方法) (torchrl.data.ReplayBuffer 方法) (torchrl.data.TensorDictPrioritizedReplayBuffer 方法) (torchrl.data.TensorDictReplayBuffer 方法) set_submodule()(torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) set_tensor_keys()(torchrl.modules.tensordict_module.DecisionTransformerInferenceWrapper 方法) set_writer()(torchrl.data.datasets.AtariDQNExperienceReplay 方法) (torchrl.data.datasets.BaseDatasetExperienceReplay 方法) (torchrl.data.datasets.D4RLExperienceReplay 方法) (torchrl.data.datasets.GenDGRLExperienceReplay 方法) (torchrl.data.datasets.MinariExperienceReplay 方法) (torchrl.data.datasets.OpenMLExperienceReplay 方法) (torchrl.data.datasets.OpenXExperienceReplay 方法) (torchrl.data.datasets.RobosetExperienceReplay 方法) (torchrl.data.datasets.VD4RLExperienceReplay 方法) (torchrl.data.PrioritizedReplayBuffer 方法) (torchrl.data.replay_buffers.ReplayBufferEnsemble 方法) (torchrl.data.ReplayBuffer 方法) (torchrl.data.TensorDictPrioritizedReplayBuffer 方法) (torchrl.data.TensorDictReplayBuffer 方法) shape(torchrl.envs.EnvBase 属性) (torchrl.envs.GymLikeEnv 属性) (torchrl.envs.ParallelEnv 属性) (torchrl.envs.PendulumEnv 属性) (torchrl.envs.SerialEnv 属性) (torchrl.envs.TicTacToeEnv 属性) share_memory()(torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) shutdown()(torchrl.collectors.aSyncDataCollector 方法) (torchrl.collectors.distributed.RayCollector 方法) (torchrl.collectors.MultiaSyncDataCollector 方法) (torchrl.collectors.MultiSyncDataCollector 方法) (torchrl.collectors.SyncDataCollector 方法) SignTransform(torchrl.envs.transforms 中的类) SliceSampler(torchrl.data.replay_buffers 中的类) SliceSamplerWithoutReplacement(torchrl.data.replay_buffers 中的类) SMACv2Env()(在模块 torchrl.envs 中) SMACv2Wrapper()(在模块 torchrl.envs 中) SoftUpdate(torchrl.objectives 中的类) specs(torchrl.envs.EnvBase 属性) (torchrl.envs.GymLikeEnv 属性) (torchrl.envs.ParallelEnv 属性) (torchrl.envs.PendulumEnv 属性) (torchrl.envs.SerialEnv 属性) (torchrl.envs.TicTacToeEnv 属性) split_trajectories()(在模块 torchrl.collectors.utils 中) squeeze()(torchrl.data.BinaryDiscreteTensorSpec 方法) (torchrl.data.BoundedTensorSpec 方法) (torchrl.data.CompositeSpec 方法) (torchrl.data.DiscreteTensorSpec 方法) (torchrl.data.LazyStackedCompositeSpec 方法) (torchrl.data.LazyStackedTensorSpec 方法) (torchrl.data.MultiDiscreteTensorSpec 方法) (torchrl.data.MultiOneHotDiscreteTensorSpec 方法) (torchrl.data.NonTensorSpec 方法) (torchrl.data.OneHotDiscreteTensorSpec 方法) (torchrl.data.TensorSpec 方法) (torchrl.data.UnboundedContinuousTensorSpec 方法) (torchrl.data.UnboundedDiscreteTensorSpec 方法) Squeeze2dLayer(torchrl.modules 中的类) SqueezeLayer(torchrl.modules 中的类) SqueezeTransform(torchrl.envs.transforms 中的类) standard_normal(torchrl.envs.transforms.VecNorm 属性) state_dict()(torchrl.collectors.aSyncDataCollector 方法) (torchrl.collectors.distributed.RayCollector 方法) (torchrl.collectors.MultiaSyncDataCollector 方法) (torchrl.collectors.MultiSyncDataCollector 方法) (torchrl.collectors.SyncDataCollector 方法) (torchrl.data.MultiStep 方法) (torchrl.data.PairwiseDataset 方法) (torchrl.data.PromptData 方法) (torchrl.data.RewardData 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) (torchrl.envs.transforms.TransformedEnv 方法) (torchrl.objectives.SACLoss 方法) state_keys(torchrl.envs.EnvBase 属性) (torchrl.envs.GymLikeEnv 属性) (torchrl.envs.ParallelEnv 属性) (torchrl.envs.PendulumEnv 属性) (torchrl.envs.SerialEnv 属性) (torchrl.envs.TicTacToeEnv 属性) state_spec(torchrl.envs.EnvBase 属性) (torchrl.envs.GymLikeEnv 属性) (torchrl.envs.ParallelEnv 属性) (torchrl.envs.PendulumEnv 属性) (torchrl.envs.SerialEnv 属性) (torchrl.envs.TicTacToeEnv 属性) step()(在模块 torchrl.envs 中) (torchrl.envs.EnvBase 方法),[1] (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.modules.tensordict_module.AdditiveGaussianModule 方法) (torchrl.modules.tensordict_module.AdditiveGaussianWrapper 方法) (torchrl.modules.tensordict_module.EGreedyModule 方法) (torchrl.modules.tensordict_module.OrnsteinUhlenbeckProcessModule 方法) (torchrl.modules.tensordict_module.OrnsteinUhlenbeckProcessWrapper 方法) step_and_maybe_reset()(torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) step_mdp()(在模块 torchrl.envs.utils 中) StepCounter(torchrl.envs.transforms 中的类) stop_remote_collectors()(torchrl.collectors.distributed.RayCollector 方法) Storage(torchrl.data.replay_buffers 中的类) storage(torchrl.data.datasets.AtariDQNExperienceReplay 属性) (torchrl.data.datasets.BaseDatasetExperienceReplay 属性) (torchrl.data.datasets.D4RLExperienceReplay 属性) (torchrl.data.datasets.GenDGRLExperienceReplay 属性) (torchrl.data.datasets.MinariExperienceReplay 属性) (torchrl.data.datasets.OpenMLExperienceReplay 属性) (torchrl.data.datasets.OpenXExperienceReplay 属性) (torchrl.data.datasets.RobosetExperienceReplay 属性) (torchrl.data.datasets.VD4RLExperienceReplay 属性) (torchrl.data.PrioritizedReplayBuffer 属性) (torchrl.data.replay_buffers.ReplayBufferEnsemble 属性) (torchrl.data.ReplayBuffer 属性) (torchrl.data.TensorDictPrioritizedReplayBuffer 属性) (torchrl.data.TensorDictReplayBuffer 属性) StorageCheckpointerBase(torchrl.data.replay_buffers 中的类) StorageEnsemble(torchrl.data.replay_buffers 中的类) StorageEnsembleCheckpointer(torchrl.data.replay_buffers 中的类) submitit_delayed_launcher(torchrl.collectors.distributed 中的类) sync_async_collector()(在模块 torchrl.trainers.helpers 中) sync_sync_collector()(在模块 torchrl.trainers.helpers 中) SyncDataCollector(torchrl.collectors 中的类) T TanhDelta(torchrl.modules 中的类) TanhModule(torchrl.modules.tensordict_module 中的类) TanhNormal(torchrl.modules 中的类) TargetReturn(torchrl.envs.transforms 中的类) td0_advantage_estimate(torchrl.objectives.value.functional 中的类) td0_return_estimate(torchrl.objectives.value.functional 中的类) TD0Estimator(torchrl.objectives.value 中的类) td1_advantage_estimate(torchrl.objectives.value.functional 中的类) td1_return_estimate(torchrl.objectives.value.functional 中的类) TD1Estimator(torchrl.objectives.value 中的类) TD3BCLoss(torchrl.objectives 中的类) TD3Loss(torchrl.objectives 中的类) td_lambda_advantage_estimate(torchrl.objectives.value.functional 中的类) td_lambda_return_estimate(torchrl.objectives.value.functional 中的类) TDLambdaEstimator(torchrl.objectives.value 中的类) TED2Flat(torchrl.data 中的类) TED2Nested(torchrl.data 中的类) TensorboardLogger()(在模块 torchrl.record.loggers.tensorboard 中) TensorDictMaxValueWriter(torchrl.data.replay_buffers 中的类) TensorDictPrimer(torchrl.envs.transforms 中的类) TensorDictPrioritizedReplayBuffer(torchrl.data 中的类) TensorDictRecorder()(在模块 torchrl.record 中) TensorDictReplayBuffer(torchrl.data 中的类) TensorDictRoundRobinWriter(torchrl.data.replay_buffers 中的类) TensorDictTokenizer(torchrl.data 中的类) TensorSpec(torchrl.data 中的类) TensorStorage(torchrl.data.replay_buffers 中的类) TensorStorageCheckpointer(torchrl.data.replay_buffers 中的类) terminated_or_truncated()(在模块 torchrl.envs.utils 中) TicTacToeEnv(torchrl.envs 中的类) TimeMaxPool(torchrl.envs.transforms 中的类) to()(torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.Compose 方法) (torchrl.envs.transforms.R3MTransform 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) (torchrl.envs.transforms.TensorDictPrimer 方法) (torchrl.envs.transforms.Transform 方法) (torchrl.envs.transforms.TransformedEnv 方法) (torchrl.envs.transforms.VC1Transform 方法) (torchrl.envs.transforms.VIPTransform 方法) (torchrl.modules.tensordict_module.SafeModule 方法) to_categorical()(torchrl.data.MultiOneHotDiscreteTensorSpec 方法) (torchrl.data.OneHotDiscreteTensorSpec 方法) to_categorical_spec()(torchrl.data.MultiOneHotDiscreteTensorSpec 方法) (torchrl.data.OneHotDiscreteTensorSpec 方法) to_empty()(torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) to_numpy()(torchrl.data.BinaryDiscreteTensorSpec 方法) (torchrl.data.BoundedTensorSpec 方法) (torchrl.data.CompositeSpec 方法) (torchrl.data.DiscreteTensorSpec 方法) (torchrl.data.LazyStackedCompositeSpec 方法) (torchrl.data.LazyStackedTensorSpec 方法) (torchrl.data.MultiDiscreteTensorSpec 方法) (torchrl.data.MultiOneHotDiscreteTensorSpec 方法) (torchrl.data.NonTensorSpec 方法) (torchrl.data.OneHotDiscreteTensorSpec 方法) (torchrl.data.TensorSpec 方法) (torchrl.data.UnboundedContinuousTensorSpec 方法) (torchrl.data.UnboundedDiscreteTensorSpec 方法) to_observation_norm()(torchrl.envs.transforms.VecNorm 方法) to_one_hot()(torchrl.data.BinaryDiscreteTensorSpec 方法) (torchrl.data.DiscreteTensorSpec 方法) (torchrl.data.MultiDiscreteTensorSpec 方法) to_one_hot_spec()(torchrl.data.BinaryDiscreteTensorSpec 方法) (torchrl.data.DiscreteTensorSpec 方法) (torchrl.data.MultiDiscreteTensorSpec 方法) to_tensordict()(torchrl.data.PairwiseDataset 方法) (torchrl.data.PromptData 方法) (torchrl.data.RewardData 方法) TokenizedDatasetLoader(torchrl.data 中的类) ToTensorImage(torchrl.envs.transforms 中的类) train()(torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) (torchrl.envs.transforms.TransformedEnv 方法) Trainer(torchrl.trainers 中的类) TrainerHookBase(torchrl.trainers 中的类) Transform(torchrl.envs.transforms 中的类) transform_done_spec()(torchrl.envs.transforms.DeviceCastTransform 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) (torchrl.envs.transforms.Transform 方法) transform_env_batch_size()(torchrl.envs.transforms.BatchSizeTransform 方法) (torchrl.envs.transforms.Compose 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) (torchrl.envs.transforms.Transform 方法) transform_env_device()(torchrl.envs.transforms.Compose 方法) (torchrl.envs.transforms.DeviceCastTransform 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) (torchrl.envs.transforms.Transform 方法) transform_input_spec()(torchrl.envs.transforms.ActionDiscretizer 方法) (torchrl.envs.transforms.BatchSizeTransform 方法) (torchrl.envs.transforms.Compose 方法) (torchrl.envs.transforms.DeviceCastTransform 方法) (torchrl.envs.transforms.DiscreteActionProjection 方法) (torchrl.envs.transforms.DTypeCastTransform 方法) (torchrl.envs.transforms.ObservationNorm 方法) (torchrl.envs.transforms.PermuteTransform 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) (torchrl.envs.transforms.RemoveEmptySpecs 方法) (torchrl.envs.transforms.RenameTransform 方法) (torchrl.envs.transforms.RewardSum 方法) (torchrl.envs.transforms.StepCounter 方法) (torchrl.envs.transforms.TargetReturn 方法) (torchrl.envs.transforms.TensorDictPrimer 方法) (torchrl.envs.transforms.Transform 方法) (torchrl.envs.transforms.UnsqueezeTransform 方法) (torchrl.envs.transforms.VIPRewardTransform 方法) transform_observation_spec()(torchrl.envs.transforms.CatFrames 方法) (torchrl.envs.transforms.CatTensors 方法) (torchrl.envs.transforms.CenterCrop 方法) (torchrl.envs.transforms.ClipTransform 方法) (torchrl.envs.transforms.Compose 方法) (torchrl.envs.transforms.Crop 方法) (torchrl.envs.transforms.DeviceCastTransform 方法) (torchrl.envs.transforms.DTypeCastTransform 方法) (torchrl.envs.transforms.EndOfLifeTransform 方法) (torchrl.envs.transforms.FlattenObservation 方法) (torchrl.envs.transforms.GrayScale 方法) (torchrl.envs.transforms.InitTracker 方法) (torchrl.envs.transforms.ObservationNorm 方法) (torchrl.envs.transforms.PermuteTransform 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) (torchrl.envs.transforms.Resize 方法) (torchrl.envs.transforms.RewardSum 方法) (torchrl.envs.transforms.SignTransform 方法) (torchrl.envs.transforms.StepCounter 方法) (torchrl.envs.transforms.TargetReturn 方法) (torchrl.envs.transforms.TensorDictPrimer 方法) (torchrl.envs.transforms.TimeMaxPool 方法) (torchrl.envs.transforms.ToTensorImage 方法) (torchrl.envs.transforms.Transform 方法) (torchrl.envs.transforms.UnsqueezeTransform 方法) (torchrl.envs.transforms.VC1Transform 方法) (torchrl.envs.transforms.VecGymEnvTransform 方法) (torchrl.envs.transforms.VecNorm 方法) transform_output_spec()(torchrl.envs.transforms.BatchSizeTransform 方法) (torchrl.envs.transforms.Compose 方法) (torchrl.envs.transforms.DeviceCastTransform 方法) (torchrl.envs.transforms.DTypeCastTransform 方法) (torchrl.envs.transforms.ExcludeTransform 方法) (torchrl.envs.transforms.KLRewardTransform 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) (torchrl.envs.transforms.RemoveEmptySpecs 方法) (torchrl.envs.transforms.RenameTransform 方法) (torchrl.envs.transforms.SelectTransform 方法) (torchrl.envs.transforms.StepCounter 方法) (torchrl.envs.transforms.Transform 方法) transform_reward_spec()(torchrl.envs.transforms.BinarizeReward 方法) (torchrl.envs.transforms.ClipTransform 方法) (torchrl.envs.transforms.Compose 方法) (torchrl.envs.transforms.DeviceCastTransform 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) (torchrl.envs.transforms.RewardClipping 方法) (torchrl.envs.transforms.RewardScaling 方法) (torchrl.envs.transforms.RewardSum 方法) (torchrl.envs.transforms.SignTransform 方法) (torchrl.envs.transforms.Transform 方法) (torchrl.envs.transforms.UnsqueezeTransform 方法) transformed_env_constructor()(在模块 torchrl.trainers.helpers 中) TransformedEnv(torchrl.envs.transforms 中的类) TruncatedNormal(torchrl.modules 中的类) type()(torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) type_check()(torchrl.data.BinaryDiscreteTensorSpec 方法) (torchrl.data.BoundedTensorSpec 方法) (torchrl.data.CompositeSpec 方法) (torchrl.data.DiscreteTensorSpec 方法) (torchrl.data.LazyStackedCompositeSpec 方法) (torchrl.data.LazyStackedTensorSpec 方法) (torchrl.data.MultiDiscreteTensorSpec 方法) (torchrl.data.MultiOneHotDiscreteTensorSpec 方法) (torchrl.data.NonTensorSpec 方法) (torchrl.data.OneHotDiscreteTensorSpec 方法) (torchrl.data.TensorSpec 方法) (torchrl.data.UnboundedContinuousTensorSpec 方法) (torchrl.data.UnboundedDiscreteTensorSpec 方法) U unbind()(torchrl.data.PairwiseDataset 方法) (torchrl.data.PromptData 方法) (torchrl.data.RewardData 方法) UnboundedContinuousTensorSpec(torchrl.data 中的类) UnboundedDiscreteTensorSpec(torchrl.data 中的类) unflatten()(torchrl.data.BinaryDiscreteTensorSpec 方法) (torchrl.data.BoundedTensorSpec 方法) (torchrl.data.CompositeSpec 方法) (torchrl.data.DiscreteTensorSpec 方法) (torchrl.data.LazyStackedCompositeSpec 方法) (torchrl.data.LazyStackedTensorSpec 方法) (torchrl.data.MultiDiscreteTensorSpec 方法) (torchrl.data.MultiOneHotDiscreteTensorSpec 方法) (torchrl.data.NonTensorSpec 方法) (torchrl.data.OneHotDiscreteTensorSpec 方法) (torchrl.data.TensorSpec 方法) (torchrl.data.UnboundedContinuousTensorSpec 方法) (torchrl.data.UnboundedDiscreteTensorSpec 方法) unfreeze()(torchrl.envs.transforms.VecNorm 方法) unlock_()(torchrl.data.CompositeSpec 方法) (torchrl.data.LazyStackedCompositeSpec 方法) UnsqueezeTransform(torchrl.envs.transforms 中的类) update()(torchrl.data.AdaptiveKLController 方法) update_kwargs()(torchrl.envs.ParallelEnv 方法) (torchrl.envs.SerialEnv 方法) update_mask()(torchrl.data.BinaryDiscreteTensorSpec 方法) (torchrl.data.DiscreteTensorSpec 方法) (torchrl.data.MultiDiscreteTensorSpec 方法) (torchrl.data.MultiOneHotDiscreteTensorSpec 方法) (torchrl.data.OneHotDiscreteTensorSpec 方法) update_policy_weights_()(torchrl.collectors.aSyncDataCollector 方法) (torchrl.collectors.DataCollectorBase 方法) (torchrl.collectors.distributed.DistributedDataCollector 方法) (torchrl.collectors.distributed.DistributedSyncDataCollector 方法) (torchrl.collectors.distributed.RayCollector 方法) (torchrl.collectors.distributed.RPCDataCollector 方法) (torchrl.collectors.MultiaSyncDataCollector 方法) (torchrl.collectors.MultiSyncDataCollector 方法) (torchrl.collectors.SyncDataCollector 方法) update_priority()(torchrl.data.replay_buffers.PrioritizedSampler 方法) (torchrl.data.replay_buffers.PrioritizedSliceSampler 方法) UpdateWeights(torchrl.trainers 中的类) V value_estimate()(torchrl.objectives.value.GAE 方法) (torchrl.objectives.value.TD0Estimator 方法) (torchrl.objectives.value.TD1Estimator 方法) (torchrl.objectives.value.TDLambdaEstimator 方法) (torchrl.objectives.value.ValueEstimatorBase 方法) value_estimator(torchrl.objectives.LossModule 属性) ValueEstimatorBase(torchrl.objectives.value 中的类) ValueEstimators(torchrl.objectives 中的类) ValueOperator(torchrl.modules.tensordict_module 中的类) values()(torchrl.data.CompositeSpec 方法) (torchrl.data.LazyStackedCompositeSpec 方法) VC1Transform(torchrl.envs.transforms 中的类) VD4RLExperienceReplay(torchrl.data.datasets 中的类) VDNMixer(torchrl.modules 中的类) vec_generalized_advantage_estimate(torchrl.objectives.value.functional 中的类) vec_td1_advantage_estimate(torchrl.objectives.value.functional 中的类) vec_td1_return_estimate(torchrl.objectives.value.functional 中的类) vec_td_lambda_advantage_estimate(torchrl.objectives.value.functional 中的类) vec_td_lambda_return_estimate(torchrl.objectives.value.functional 中的类) VecGymEnvTransform(torchrl.envs.transforms 中的类) VecNorm(torchrl.envs.transforms 中的类) VideoRecorder()(在模块 torchrl.record 中) view()(torchrl.data.BinaryDiscreteTensorSpec 方法) (torchrl.data.BoundedTensorSpec 方法) (torchrl.data.CompositeSpec 方法) (torchrl.data.DiscreteTensorSpec 方法) (torchrl.data.LazyStackedCompositeSpec 方法) (torchrl.data.LazyStackedTensorSpec 方法) (torchrl.data.MultiDiscreteTensorSpec 方法) (torchrl.data.MultiOneHotDiscreteTensorSpec 方法) (torchrl.data.NonTensorSpec 方法) (torchrl.data.OneHotDiscreteTensorSpec 方法) (torchrl.data.TensorSpec 方法) (torchrl.data.UnboundedContinuousTensorSpec 方法) (torchrl.data.UnboundedDiscreteTensorSpec 方法) VIPRewardTransform(torchrl.envs.transforms 中的类) VIPTransform(torchrl.envs.transforms 中的类) vmap_randomness(torchrl.objectives.LossModule 属性) VmapModule(torchrl.modules 中的类) VmasEnv()(在模块 torchrl.envs 中) VmasWrapper()(在模块 torchrl.envs 中) W WandbLogger()(在模块 torchrl.record.loggers.wandb 中) WorldModelWrapper(torchrl.modules.tensordict_module 中的类) Writer(torchrl.data.replay_buffers 中的类) writer(torchrl.data.datasets.AtariDQNExperienceReplay 属性) (torchrl.data.datasets.BaseDatasetExperienceReplay 属性) (torchrl.data.datasets.D4RLExperienceReplay 属性) (torchrl.data.datasets.GenDGRLExperienceReplay 属性) (torchrl.data.datasets.MinariExperienceReplay 属性) (torchrl.data.datasets.OpenMLExperienceReplay 属性) (torchrl.data.datasets.OpenXExperienceReplay 属性) (torchrl.data.datasets.RobosetExperienceReplay 属性) (torchrl.data.datasets.VD4RLExperienceReplay 属性) (torchrl.data.PrioritizedReplayBuffer 属性) (torchrl.data.replay_buffers.ReplayBufferEnsemble 属性) (torchrl.data.ReplayBuffer 属性) (torchrl.data.TensorDictPrioritizedReplayBuffer 属性) (torchrl.data.TensorDictReplayBuffer 属性) WriterEnsemble(torchrl.data.replay_buffers 中的类) X xpu()(torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法) Z zero()(torchrl.data.BinaryDiscreteTensorSpec 方法) (torchrl.data.BoundedTensorSpec 方法) (torchrl.data.CompositeSpec 方法) (torchrl.data.DiscreteTensorSpec 方法) (torchrl.data.LazyStackedCompositeSpec 方法) (torchrl.data.LazyStackedTensorSpec 方法) (torchrl.data.MultiDiscreteTensorSpec 方法) (torchrl.data.MultiOneHotDiscreteTensorSpec 方法) (torchrl.data.NonTensorSpec 方法) (torchrl.data.OneHotDiscreteTensorSpec 方法) (torchrl.data.TensorSpec 方法) (torchrl.data.UnboundedContinuousTensorSpec 方法) (torchrl.data.UnboundedDiscreteTensorSpec 方法) zero_grad()(torchrl.data.MultiStep 方法) (torchrl.envs.EnvBase 方法) (torchrl.envs.GymLikeEnv 方法) (torchrl.envs.ParallelEnv 方法) (torchrl.envs.PendulumEnv 方法) (torchrl.envs.SerialEnv 方法) (torchrl.envs.TicTacToeEnv 方法) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 方法)