索引 A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Z A A2CLoss(`torchrl.objectives` 中的类) action_key(`torchrl.envs.ChessEnv` 属性) (`torchrl.envs.EnvBase` 属性) (`torchrl.envs.GymLikeEnv` 属性) (`torchrl.envs.LLMHashingEnv` 属性) (`torchrl.envs.ParallelEnv` 属性) (`torchrl.envs.PendulumEnv` 属性) (`torchrl.envs.SerialEnv` 属性) (`torchrl.envs.TicTacToeEnv` 属性) action_keys(`torchrl.data.MCTSForest` 属性) (`torchrl.envs.ChessEnv` 属性) (`torchrl.envs.EnvBase` 属性) (`torchrl.envs.GymLikeEnv` 属性) (`torchrl.envs.LLMHashingEnv` 属性) (`torchrl.envs.ParallelEnv` 属性) (`torchrl.envs.PendulumEnv` 属性) (`torchrl.envs.SerialEnv` 属性) (`torchrl.envs.TicTacToeEnv` 属性) action_spec(`torchrl.envs.ChessEnv` 属性) (`torchrl.envs.EnvBase` 属性) (`torchrl.envs.GymLikeEnv` 属性) (`torchrl.envs.LLMHashingEnv` 属性) (`torchrl.envs.ParallelEnv` 属性) (`torchrl.envs.PendulumEnv` 属性) (`torchrl.envs.SerialEnv` 属性) (`torchrl.envs.TicTacToeEnv` 属性) action_spec_unbatched(`torchrl.envs.ChessEnv` 属性) (`torchrl.envs.EnvBase` 属性) (`torchrl.envs.GymLikeEnv` 属性) (`torchrl.envs.LLMHashingEnv` 属性) (`torchrl.envs.ParallelEnv` 属性) (`torchrl.envs.PendulumEnv` 属性) (`torchrl.envs.SerialEnv` 属性) (`torchrl.envs.TicTacToeEnv` 属性) ActionDiscretizer(`torchrl.envs.transforms` 中的类) ActionDiscretizer.SamplingStrategy(`torchrl.envs.transforms` 中的类) ActionMask(`torchrl.envs.transforms` 中的类) Actor(`torchrl.modules.tensordict_module` 中的类) actor_loss()(`torchrl.objectives.CrossQLoss` 方法) (`torchrl.objectives.TD3BCLoss` 方法) ActorCriticOperator(`torchrl.modules.tensordict_module` 中的类) ActorCriticWrapper(`torchrl.modules.tensordict_module` 中的类) ActorValueOperator(`torchrl.modules.tensordict_module` 中的类) AdaptiveKLController(`torchrl.data` 中的类) add()(`torchrl.data.datasets.AtariDQNExperienceReplay` 方法) (`torchrl.data.datasets.BaseDatasetExperienceReplay` 方法) (`torchrl.data.datasets.D4RLExperienceReplay` 方法) (`torchrl.data.datasets.GenDGRLExperienceReplay` 方法) (`torchrl.data.datasets.MinariExperienceReplay` 方法) (`torchrl.data.datasets.OpenMLExperienceReplay` 方法) (`torchrl.data.datasets.OpenXExperienceReplay` 方法) (`torchrl.data.datasets.RobosetExperienceReplay` 方法) (`torchrl.data.datasets.VD4RLExperienceReplay` 方法) (`torchrl.data.PrioritizedReplayBuffer` 方法) (`torchrl.data.replay_buffers.ImmutableDatasetWriter` 方法) (`torchrl.data.replay_buffers.ReplayBufferEnsemble` 方法) (`torchrl.data.replay_buffers.RoundRobinWriter` 方法) (`torchrl.data.replay_buffers.TensorDictMaxValueWriter` 方法) (`torchrl.data.replay_buffers.TensorDictRoundRobinWriter` 方法) (`torchrl.data.replay_buffers.Writer` 方法) (`torchrl.data.replay_buffers.WriterEnsemble` 方法) (`torchrl.data.ReplayBuffer` 方法) (`torchrl.data.TensorDictPrioritizedReplayBuffer` 方法) (`torchrl.data.TensorDictReplayBuffer` 方法) add_collectors()(`torchrl.collectors.distributed.RayCollector` 方法) add_module()(`torchrl.data.BinaryToDecimal` 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) add_truncated_keys()(`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.TransformedEnv` 方法) AdditiveGaussianModule(`torchrl.modules` 中的类) all_actions()(`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) alpha_loss()(`torchrl.objectives.CrossQLoss` 方法) append()(`torchrl.envs.transforms.Compose` 方法) append_transform()(`torchrl.data.datasets.AtariDQNExperienceReplay` 方法) (`torchrl.data.datasets.BaseDatasetExperienceReplay` 方法) (`torchrl.data.datasets.D4RLExperienceReplay` 方法) (`torchrl.data.datasets.GenDGRLExperienceReplay` 方法) (`torchrl.data.datasets.MinariExperienceReplay` 方法) (`torchrl.data.datasets.OpenMLExperienceReplay` 方法) (`torchrl.data.datasets.OpenXExperienceReplay` 方法) (`torchrl.data.datasets.RobosetExperienceReplay` 方法) (`torchrl.data.datasets.VD4RLExperienceReplay` 方法) (`torchrl.data.PrioritizedReplayBuffer` 方法) (`torchrl.data.replay_buffers.ReplayBufferEnsemble` 方法) (`torchrl.data.ReplayBuffer` 方法) (`torchrl.data.TensorDictPrioritizedReplayBuffer` 方法) (`torchrl.data.TensorDictReplayBuffer` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.TransformedEnv` 方法) apply()(`torchrl.data.BinaryToDecimal` 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) assert_is_in()(`torchrl.data.Binary` 方法) (`torchrl.data.BinaryDiscreteTensorSpec` 方法) (`torchrl.data.Bounded` 方法) (`torchrl.data.BoundedTensorSpec` 方法) (`torchrl.data.Categorical` 方法) (`torchrl.data.Composite` 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.DiscreteTensorSpec` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.LazyStackedTensorSpec` 方法) (`torchrl.data.MultiCategorical` 方法) (`torchrl.data.MultiDiscreteTensorSpec` 方法) (`torchrl.data.MultiOneHot` 方法) (`torchrl.data.MultiOneHotDiscreteTensorSpec` 方法) (`torchrl.data.NonTensor` 方法) (`torchrl.data.NonTensorSpec` 方法) (`torchrl.data.OneHot` 方法) (`torchrl.data.OneHotDiscreteTensorSpec` 方法) (`torchrl.data.Stacked` 方法) (`torchrl.data.StackedComposite` 方法) (`torchrl.data.TensorSpec` 方法) (`torchrl.data.Unbounded` 方法) (`torchrl.data.UnboundedContinuous` 方法) (`torchrl.data.UnboundedContinuousTensorSpec` 方法) (`torchrl.data.UnboundedDiscrete` 方法) (`torchrl.data.UnboundedDiscreteTensorSpec` 方法) aSyncDataCollector(`torchrl.collectors` 中的类) AtariDQNExperienceReplay(`torchrl.data.datasets` 中的类) attach()(`torchrl.data.replay_buffers.LazyMemmapStorage` 方法) (`torchrl.data.replay_buffers.LazyStackStorage` 方法) (`torchrl.data.replay_buffers.LazyTensorStorage` 方法) (`torchrl.data.replay_buffers.ListStorage` 方法) (`torchrl.data.replay_buffers.Storage` 方法) (`torchrl.data.replay_buffers.StorageEnsemble` 方法) (`torchrl.data.replay_buffers.TensorStorage` 方法) auto_register_info_dict()(`torchrl.envs.GymLikeEnv` 方法) auto_specs_()(`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) AutoResetEnv(`torchrl.envs.transforms` 中的类) AutoResetTransform(`torchrl.envs.transforms` 中的类) B BaseDatasetExperienceReplay(`torchrl.data.datasets` 中的类) batch_dims(`torchrl.envs.ChessEnv` 属性) (`torchrl.envs.EnvBase` 属性) (`torchrl.envs.GymLikeEnv` 属性) (`torchrl.envs.LLMHashingEnv` 属性) (`torchrl.envs.ParallelEnv` 属性) (`torchrl.envs.PendulumEnv` 属性) (`torchrl.envs.SerialEnv` 属性) (`torchrl.envs.TicTacToeEnv` 属性) batch_locked(`torchrl.envs.ChessEnv` 属性) (`torchrl.envs.EnvBase` 属性) (`torchrl.envs.GymLikeEnv` 属性) (`torchrl.envs.LLMHashingEnv` 属性) (`torchrl.envs.ParallelEnv` 属性) (`torchrl.envs.SerialEnv` 属性) (`torchrl.envs.transforms.TransformedEnv` 属性) batch_size(`torchrl.envs.ChessEnv` 属性) (`torchrl.envs.EnvBase` 属性) (`torchrl.envs.GymLikeEnv` 属性) (`torchrl.envs.LLMHashingEnv` 属性) (`torchrl.envs.ParallelEnv` 属性) (`torchrl.envs.PendulumEnv` 属性) (`torchrl.envs.SerialEnv` 属性) (`torchrl.envs.TicTacToeEnv` 属性) (`torchrl.envs.transforms.TransformedEnv` 属性) BatchRenorm1d(`torchrl.modules` 中的类) BatchSizeTransform(`torchrl.envs.transforms` 中的类) BatchSubSampler(`torchrl.trainers` 中的类) bfloat16()(`torchrl.data.BinaryToDecimal` 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) biased_softplus(`torchrl.modules.utils` 中的类) BinarizeReward(`torchrl.envs.transforms` 中的类) Binary(`torchrl.data` 中的类) BinaryDiscreteTensorSpec(`torchrl.data` 中的类) BinaryToDecimal(`torchrl.data` 中的类) Bounded(`torchrl.data` 中的类) BoundedTensorSpec(`torchrl.data` 中的类) branching_action(`torchrl.data.Tree` 属性) BraxEnv()(在模块 `torchrl.envs` 中) BraxWrapper()(在模块 `torchrl.envs` 中) buffers()(`torchrl.data.BinaryToDecimal` 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) build_td_for_shared_vecnorm()(`torchrl.envs.transforms.VecNorm` 静态方法) BurnInTransform(`torchrl.envs.transforms` 中的类) C cardinality()(`torchrl.data.Binary` 方法) (`torchrl.data.BinaryDiscreteTensorSpec` 方法) (`torchrl.data.Bounded` 方法) (`torchrl.data.BoundedTensorSpec` 方法) (`torchrl.data.Categorical` 方法) (`torchrl.data.Composite` 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.DiscreteTensorSpec` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.LazyStackedTensorSpec` 方法) (`torchrl.data.MultiCategorical` 方法) (`torchrl.data.MultiDiscreteTensorSpec` 方法) (`torchrl.data.MultiOneHot` 方法) (`torchrl.data.MultiOneHotDiscreteTensorSpec` 方法) (`torchrl.data.NonTensor` 方法) (`torchrl.data.NonTensorSpec` 方法) (`torchrl.data.OneHot` 方法) (`torchrl.data.OneHotDiscreteTensorSpec` 方法) (`torchrl.data.Stacked` 方法) (`torchrl.data.StackedComposite` 方法) (`torchrl.data.TensorSpec` 方法) (`torchrl.data.Unbounded` 方法) (`torchrl.data.UnboundedContinuous` 方法) (`torchrl.data.UnboundedContinuousTensorSpec` 方法) (`torchrl.data.UnboundedDiscrete` 方法) (`torchrl.data.UnboundedDiscreteTensorSpec` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) Categorical(`torchrl.data` 中的类) CatFrames(`torchrl.envs.transforms` 中的类) CatTensors(`torchrl.envs.transforms` 中的类) CEMPlanner(`torchrl.modules` 中的类) CenterCrop(`torchrl.envs.transforms` 中的类) check_env_specs()(在模块 `torchrl.envs.utils` 中) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) check_marl_grouping()(在模块 `torchrl.envs` 中) check_no_exclusive_keys(`torchrl.data` 中的类) ChessEnv(`torchrl.envs` 中的类) children()(`torchrl.data.BinaryToDecimal` 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) clear_device_()(`torchrl.data.Binary` 方法) (`torchrl.data.BinaryDiscreteTensorSpec` 方法) (`torchrl.data.Bounded` 方法) (`torchrl.data.BoundedTensorSpec` 方法) (`torchrl.data.Categorical` 方法) (`torchrl.data.Composite` 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.DiscreteTensorSpec` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.LazyStackedTensorSpec` 方法) (`torchrl.data.MultiCategorical` 方法) (`torchrl.data.MultiDiscreteTensorSpec` 方法) (`torchrl.data.MultiOneHot` 方法) (`torchrl.data.MultiOneHotDiscreteTensorSpec` 方法) (`torchrl.data.NonTensor` 方法) (`torchrl.data.NonTensorSpec` 方法) (`torchrl.data.OneHot` 方法) (`torchrl.data.OneHotDiscreteTensorSpec` 方法) (`torchrl.data.Stacked` 方法) (`torchrl.data.StackedComposite` 方法) (`torchrl.data.TensorSpec` 方法) (`torchrl.data.Unbounded` 方法) (`torchrl.data.UnboundedContinuous` 方法) (`torchrl.data.UnboundedContinuousTensorSpec` 方法) (`torchrl.data.UnboundedDiscrete` 方法) (`torchrl.data.UnboundedDiscreteTensorSpec` 方法) ClearCudaCache(`torchrl.trainers` 中的类) ClipPPOLoss(`torchrl.objectives` 中的类) ClipTransform(`torchrl.envs.transforms` 中的类) clone()(`torchrl.data.Binary` 方法) (`torchrl.data.BinaryDiscreteTensorSpec` 方法) (`torchrl.data.Bounded` 方法) (`torchrl.data.BoundedTensorSpec` 方法) (`torchrl.data.Categorical` 方法) (`torchrl.data.Composite` 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.DiscreteTensorSpec` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.LazyStackedTensorSpec` 方法) (`torchrl.data.MultiCategorical` 方法) (`torchrl.data.MultiDiscreteTensorSpec` 方法) (`torchrl.data.MultiOneHot` 方法) (`torchrl.data.MultiOneHotDiscreteTensorSpec` 方法) (`torchrl.data.NonTensor` 方法) (`torchrl.data.NonTensorSpec` 方法) (`torchrl.data.OneHot` 方法) (`torchrl.data.OneHotDiscreteTensorSpec` 方法) (`torchrl.data.Stacked` 方法) (`torchrl.data.StackedComposite` 方法) (`torchrl.data.TensorSpec` 方法) (`torchrl.data.Unbounded` 方法) (`torchrl.data.UnboundedContinuous` 方法) (`torchrl.data.UnboundedContinuousTensorSpec` 方法) (`torchrl.data.UnboundedDiscrete` 方法) (`torchrl.data.UnboundedDiscreteTensorSpec` 方法) close()(`torchrl.envs.GymLikeEnv` 方法) compile()(`torchrl.data.BinaryToDecimal` 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) Compose(`torchrl.envs.transforms` 中的类) Composite(`torchrl.data` 中的类) CompositeSpec(`torchrl.data` 中的类) ConsistentDropout(`torchrl.modules` 中的类) ConsistentDropoutModule(`torchrl.modules` 中的类) consolidate_spec(`torchrl.data` 中的类) ConstantKLController(`torchrl.data` 中的类) container(`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 属性) (`torchrl.envs.transforms.Transform` 属性) contains()(`torchrl.data.Binary` 方法) (`torchrl.data.BinaryDiscreteTensorSpec` 方法) (`torchrl.data.Bounded` 方法) (`torchrl.data.BoundedTensorSpec` 方法) (`torchrl.data.Categorical` 方法) (`torchrl.data.Composite` 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.DiscreteTensorSpec` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.LazyStackedTensorSpec` 方法) (`torchrl.data.MultiCategorical` 方法) (`torchrl.data.MultiDiscreteTensorSpec` 方法) (`torchrl.data.MultiOneHot` 方法) (`torchrl.data.MultiOneHotDiscreteTensorSpec` 方法) (`torchrl.data.NonTensor` 方法) (`torchrl.data.NonTensorSpec` 方法) (`torchrl.data.OneHot` 方法) (`torchrl.data.OneHotDiscreteTensorSpec` 方法) (`torchrl.data.Stacked` 方法) (`torchrl.data.StackedComposite` 方法) (`torchrl.data.TensorSpec` 方法) (`torchrl.data.Unbounded` 方法) (`torchrl.data.UnboundedContinuous` 方法) (`torchrl.data.UnboundedContinuousTensorSpec` 方法) (`torchrl.data.UnboundedDiscrete` 方法) (`torchrl.data.UnboundedDiscreteTensorSpec` 方法) contains_lazy_spec(`torchrl.data` 中的类) Conv3dNet(`torchrl.modules` 中的类) convert_to_functional()(`torchrl.objectives.LossModule` 方法) ConvNet(`torchrl.modules` 中的类) correct_for_frame_skip()(在模块 `torchrl.trainers.helpers` 中) CountFramesLog(`torchrl.trainers` 中的类) cpu()(`torchrl.data.Binary` 方法) (`torchrl.data.BinaryDiscreteTensorSpec` 方法) (`torchrl.data.BinaryToDecimal` 方法) (`torchrl.data.Bounded` 方法) (`torchrl.data.BoundedTensorSpec` 方法) (`torchrl.data.Categorical` 方法) (`torchrl.data.Composite` 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.DiscreteTensorSpec` 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.LazyStackedTensorSpec` 方法) (`torchrl.data.MultiCategorical` 方法) (`torchrl.data.MultiDiscreteTensorSpec` 方法) (`torchrl.data.MultiOneHot` 方法) (`torchrl.data.MultiOneHotDiscreteTensorSpec` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.NonTensor` 方法) (`torchrl.data.NonTensorSpec` 方法) (`torchrl.data.OneHot` 方法) (`torchrl.data.OneHotDiscreteTensorSpec` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.Stacked` 方法) (`torchrl.data.StackedComposite` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.data.TensorSpec` 方法) (`torchrl.data.Unbounded` 方法) (`torchrl.data.UnboundedContinuous` 方法) (`torchrl.data.UnboundedContinuousTensorSpec` 方法) (`torchrl.data.UnboundedDiscrete` 方法) (`torchrl.data.UnboundedDiscreteTensorSpec` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) CQLLoss(`torchrl.objectives` 中的类) create_infinite_iterator(`torchrl.data` 中的类) create_rollout_td()(`torchrl.data.RolloutFromModel` 方法) Crop(`torchrl.envs.transforms` 中的类) CrossQLoss(`torchrl.objectives` 中的类) CSVLogger()(在模块 `torchrl.record.loggers.csv` 中) cuda()(`torchrl.data.Binary` 方法) (`torchrl.data.BinaryDiscreteTensorSpec` 方法) (`torchrl.data.BinaryToDecimal` 方法) (`torchrl.data.Bounded` 方法) (`torchrl.data.BoundedTensorSpec` 方法) (`torchrl.data.Categorical` 方法) (`torchrl.data.Composite` 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.DiscreteTensorSpec` 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.LazyStackedTensorSpec` 方法) (`torchrl.data.MultiCategorical` 方法) (`torchrl.data.MultiDiscreteTensorSpec` 方法) (`torchrl.data.MultiOneHot` 方法) (`torchrl.data.MultiOneHotDiscreteTensorSpec` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.NonTensor` 方法) (`torchrl.data.NonTensorSpec` 方法) (`torchrl.data.OneHot` 方法) (`torchrl.data.OneHotDiscreteTensorSpec` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.Stacked` 方法) (`torchrl.data.StackedComposite` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.data.TensorSpec` 方法) (`torchrl.data.Unbounded` 方法) (`torchrl.data.UnboundedContinuous` 方法) (`torchrl.data.UnboundedContinuousTensorSpec` 方法) (`torchrl.data.UnboundedDiscrete` 方法) (`torchrl.data.UnboundedDiscreteTensorSpec` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) D D4RLExperienceReplay(`torchrl.data.datasets` 中的类) data_path(`torchrl.data.datasets.AtariDQNExperienceReplay` 属性) (`torchrl.data.datasets.BaseDatasetExperienceReplay` 属性) (`torchrl.data.datasets.D4RLExperienceReplay` 属性) (`torchrl.data.datasets.GenDGRLExperienceReplay` 属性) (`torchrl.data.datasets.MinariExperienceReplay` 属性) (`torchrl.data.datasets.OpenMLExperienceReplay` 属性) (`torchrl.data.datasets.OpenXExperienceReplay` 属性) (`torchrl.data.datasets.RobosetExperienceReplay` 属性) (`torchrl.data.datasets.VD4RLExperienceReplay` 属性) data_path_root(`torchrl.data.datasets.AtariDQNExperienceReplay` 属性) (`torchrl.data.datasets.BaseDatasetExperienceReplay` 属性) (`torchrl.data.datasets.D4RLExperienceReplay` 属性) (`torchrl.data.datasets.GenDGRLExperienceReplay` 属性) (`torchrl.data.datasets.MinariExperienceReplay` 属性) (`torchrl.data.datasets.OpenMLExperienceReplay` 属性) (`torchrl.data.datasets.OpenXExperienceReplay` 属性) (`torchrl.data.datasets.RobosetExperienceReplay` 属性) (`torchrl.data.datasets.VD4RLExperienceReplay` 属性) DataCollectorBase(`torchrl.collectors` 中的类) dataset_to_tensordict()(`torchrl.data.TokenizedDatasetLoader` 静态方法) DdpgCnnActor(`torchrl.modules` 中的类) DdpgCnnQNet(`torchrl.modules` 中的类) DDPGLoss(`torchrl.objectives` 中的类) DdpgMlpActor(`torchrl.modules` 中的类) DdpgMlpQNet(`torchrl.modules` 中的类) DecisionTransformer(`torchrl.modules` 中的类) DecisionTransformer.DTConfig(`torchrl.modules` 中的类) DecisionTransformerInferenceWrapper(`torchrl.modules.tensordict_module` 中的类) default_atari_dqn()(`torchrl.modules.ConvNet` 类方法) default_config()(`torchrl.modules.DTActor` 类方法) (`torchrl.modules.OnlineDTActor` 类方法) default_keys(`torchrl.objectives.A2CLoss` 属性) (`torchrl.objectives.CQLLoss` 属性) (`torchrl.objectives.CrossQLoss` 属性) (`torchrl.objectives.DDPGLoss` 属性) (`torchrl.objectives.DiscreteCQLLoss` 属性) (`torchrl.objectives.DiscreteIQLLoss` 属性) (`torchrl.objectives.DiscreteSACLoss` 属性) (`torchrl.objectives.DistributionalDQNLoss` 属性) (`torchrl.objectives.DQNLoss` 属性) (`torchrl.objectives.DreamerActorLoss` 属性) (`torchrl.objectives.DreamerModelLoss` 属性) (`torchrl.objectives.DreamerValueLoss` 属性) (`torchrl.objectives.DTLoss` 属性) (`torchrl.objectives.GAILLoss` 属性) (`torchrl.objectives.IQLLoss` 属性) (`torchrl.objectives.multiagent.QMixerLoss` 属性) (`torchrl.objectives.OnlineDTLoss` 属性) (`torchrl.objectives.PPOLoss` 属性) (`torchrl.objectives.REDQLoss` 属性) (`torchrl.objectives.ReinforceLoss` 属性) (`torchrl.objectives.SACLoss` 属性) (`torchrl.objectives.TD3BCLoss` 属性) (`torchrl.objectives.TD3Loss` 属性) (`torchrl.objectives.value.ValueEstimatorBase` 属性) default_value_kwargs(`torchrl.objectives` 中的类) delete()(`torchrl.data.datasets.AtariDQNExperienceReplay` 方法) (`torchrl.data.datasets.BaseDatasetExperienceReplay` 方法) (`torchrl.data.datasets.D4RLExperienceReplay` 方法) (`torchrl.data.datasets.GenDGRLExperienceReplay` 方法) (`torchrl.data.datasets.MinariExperienceReplay` 方法) (`torchrl.data.datasets.OpenMLExperienceReplay` 方法) (`torchrl.data.datasets.OpenXExperienceReplay` 方法) (`torchrl.data.datasets.RobosetExperienceReplay` 方法) (`torchrl.data.datasets.VD4RLExperienceReplay` 方法) Delta(`torchrl.modules` 中的类) device(`torchrl.data.Binary` 属性) (`torchrl.data.BinaryDiscreteTensorSpec` 属性) (`torchrl.data.Bounded` 属性) (`torchrl.data.BoundedTensorSpec` 属性) (`torchrl.data.Categorical` 属性) (`torchrl.data.Composite` 属性) (`torchrl.data.CompositeSpec` 属性) (`torchrl.data.DiscreteTensorSpec` 属性) (`torchrl.data.LazyStackedCompositeSpec` 属性) (`torchrl.data.LazyStackedTensorSpec` 属性) (`torchrl.data.MultiCategorical` 属性) (`torchrl.data.MultiDiscreteTensorSpec` 属性) (`torchrl.data.MultiOneHot` 属性) (`torchrl.data.MultiOneHotDiscreteTensorSpec` 属性) (`torchrl.data.NonTensor` 属性) (`torchrl.data.NonTensorSpec` 属性) (`torchrl.data.OneHot` 属性) (`torchrl.data.OneHotDiscreteTensorSpec` 属性) (`torchrl.data.PairwiseDataset` 属性) (`torchrl.data.PromptData` 属性) (`torchrl.data.RewardData` 属性) (`torchrl.data.Stacked` 属性) (`torchrl.data.StackedComposite` 属性) (`torchrl.data.TensorSpec` 属性) (`torchrl.data.Tree` 属性) (`torchrl.data.Unbounded` 属性) (`torchrl.data.UnboundedContinuous` 属性) (`torchrl.data.UnboundedContinuousTensorSpec` 属性) (`torchrl.data.UnboundedDiscrete` 属性) (`torchrl.data.UnboundedDiscreteTensorSpec` 属性) DeviceCastTransform(`torchrl.envs.transforms` 中的类) DiscreteActionProjection(`torchrl.envs.transforms` 中的类) DiscreteCQLLoss(`torchrl.objectives` 中的类) DiscreteIQLLoss(`torchrl.objectives` 中的类) DiscreteSACLoss(`torchrl.objectives` 中的类) DiscreteTensorSpec(`torchrl.data` 中的类) distance_loss(`torchrl.objectives` 中的类) DistributedDataCollector(`torchrl.collectors.distributed` 中的类) DistributedSyncDataCollector(`torchrl.collectors.distributed` 中的类) DistributionalDQNLoss(`torchrl.objectives` 中的类) DistributionalDQNnet(`torchrl.modules` 中的类) DistributionalQValueActor(`torchrl.modules.tensordict_module` 中的类) DistributionalQValueHook(`torchrl.modules` 中的类) DistributionalQValueModule(`torchrl.modules.tensordict_module` 中的类) DMControlEnv()(在模块 `torchrl.envs` 中) DMControlWrapper()(在模块 `torchrl.envs` 中) done_key(`torchrl.envs.ChessEnv` 属性) (`torchrl.envs.EnvBase` 属性) (`torchrl.envs.GymLikeEnv` 属性) (`torchrl.envs.LLMHashingEnv` 属性) (`torchrl.envs.ParallelEnv` 属性) (`torchrl.envs.PendulumEnv` 属性) (`torchrl.envs.SerialEnv` 属性) (`torchrl.envs.TicTacToeEnv` 属性) done_keys(`torchrl.data.MCTSForest` 属性) (`torchrl.envs.ChessEnv` 属性) (`torchrl.envs.EnvBase` 属性) (`torchrl.envs.GymLikeEnv` 属性) (`torchrl.envs.LLMHashingEnv` 属性) (`torchrl.envs.ParallelEnv` 属性) (`torchrl.envs.PendulumEnv` 属性) (`torchrl.envs.SerialEnv` 属性) (`torchrl.envs.TicTacToeEnv` 属性) done_keys_groups(`torchrl.envs.ChessEnv` 属性) (`torchrl.envs.EnvBase` 属性) (`torchrl.envs.GymLikeEnv` 属性) (`torchrl.envs.LLMHashingEnv` 属性) (`torchrl.envs.ParallelEnv` 属性) (`torchrl.envs.PendulumEnv` 属性) (`torchrl.envs.SerialEnv` 属性) (`torchrl.envs.TicTacToeEnv` 属性) done_spec(`torchrl.envs.ChessEnv` 属性) (`torchrl.envs.EnvBase` 属性) (`torchrl.envs.GymLikeEnv` 属性) (`torchrl.envs.LLMHashingEnv` 属性) (`torchrl.envs.ParallelEnv` 属性) (`torchrl.envs.PendulumEnv` 属性) (`torchrl.envs.SerialEnv` 属性) (`torchrl.envs.TicTacToeEnv` 属性) done_spec_unbatched(`torchrl.envs.ChessEnv` 属性) (`torchrl.envs.EnvBase` 属性) (`torchrl.envs.GymLikeEnv` 属性) (`torchrl.envs.LLMHashingEnv` 属性) (`torchrl.envs.ParallelEnv` 属性) (`torchrl.envs.PendulumEnv` 属性) (`torchrl.envs.SerialEnv` 属性) (`torchrl.envs.TicTacToeEnv` 属性) double()(`torchrl.data.BinaryToDecimal` 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) DoubleToFloat(`torchrl.envs.transforms` 中的类) DQNLoss(`torchrl.objectives` 中的类) DreamerActor(`torchrl.modules` 中的类) DreamerActorLoss(`torchrl.objectives` 中的类) DreamerDecoder()(在模块 `torchrl.envs.model_based.dreamer` 中) DreamerEnv()(在模块 `torchrl.envs.model_based.dreamer` 中) DreamerModelLoss(`torchrl.objectives` 中的类) DreamerValueLoss(`torchrl.objectives` 中的类) DTActor(`torchrl.modules` 中的类) DTLoss(`torchrl.objectives` 中的类) DTypeCastTransform(`torchrl.envs.transforms` 中的类) DuelingCnnDQNet(`torchrl.modules` 中的类) dump()(`torchrl.data.datasets.AtariDQNExperienceReplay` 方法) (`torchrl.data.datasets.BaseDatasetExperienceReplay` 方法) (`torchrl.data.datasets.D4RLExperienceReplay` 方法) (`torchrl.data.datasets.GenDGRLExperienceReplay` 方法) (`torchrl.data.datasets.MinariExperienceReplay` 方法) (`torchrl.data.datasets.OpenMLExperienceReplay` 方法) (`torchrl.data.datasets.OpenXExperienceReplay` 方法) (`torchrl.data.datasets.RobosetExperienceReplay` 方法) (`torchrl.data.datasets.VD4RLExperienceReplay` 方法) (`torchrl.data.PrioritizedReplayBuffer` 方法) (`torchrl.data.replay_buffers.LazyMemmapStorage` 方法) (`torchrl.data.replay_buffers.LazyStackStorage` 方法) (`torchrl.data.replay_buffers.LazyTensorStorage` 方法) (`torchrl.data.replay_buffers.ListStorage` 方法) (`torchrl.data.replay_buffers.ReplayBufferEnsemble` 方法) (`torchrl.data.replay_buffers.Storage` 方法) (`torchrl.data.replay_buffers.StorageEnsemble` 方法) (`torchrl.data.replay_buffers.TensorStorage` 方法) (`torchrl.data.ReplayBuffer` 方法) (`torchrl.data.TensorDictPrioritizedReplayBuffer` 方法) (`torchrl.data.TensorDictReplayBuffer` 方法) dumps()(`torchrl.data.datasets.AtariDQNExperienceReplay` 方法) (`torchrl.data.datasets.BaseDatasetExperienceReplay` 方法) (`torchrl.data.datasets.D4RLExperienceReplay` 方法) (`torchrl.data.datasets.GenDGRLExperienceReplay` 方法) (`torchrl.data.datasets.MinariExperienceReplay` 方法) (`torchrl.data.datasets.OpenMLExperienceReplay` 方法) (`torchrl.data.datasets.OpenXExperienceReplay` 方法) (`torchrl.data.datasets.RobosetExperienceReplay` 方法) (`torchrl.data.datasets.VD4RLExperienceReplay` 方法) (`torchrl.data.PairwiseDataset` 方法) (`torchrl.data.PrioritizedReplayBuffer` 方法) (`torchrl.data.PromptData` 方法) (`torchrl.data.replay_buffers.ReplayBufferEnsemble` 方法) (`torchrl.data.ReplayBuffer` 方法) (`torchrl.data.RewardData` 方法) (`torchrl.data.TensorDictPrioritizedReplayBuffer` 方法) (`torchrl.data.TensorDictReplayBuffer` 方法) (`torchrl.data.Tree` 方法) E edges()(`torchrl.data.Tree` 方法) EGreedyModule(`torchrl.modules` 中的类) empty()(`torchrl.data.Composite` 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.datasets.AtariDQNExperienceReplay` 方法) (`torchrl.data.datasets.BaseDatasetExperienceReplay` 方法) (`torchrl.data.datasets.D4RLExperienceReplay` 方法) (`torchrl.data.datasets.GenDGRLExperienceReplay` 方法) (`torchrl.data.datasets.MinariExperienceReplay` 方法) (`torchrl.data.datasets.OpenMLExperienceReplay` 方法) (`torchrl.data.datasets.OpenXExperienceReplay` 方法) (`torchrl.data.datasets.RobosetExperienceReplay` 方法) (`torchrl.data.datasets.VD4RLExperienceReplay` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.PrioritizedReplayBuffer` 方法) (`torchrl.data.replay_buffers.ReplayBufferEnsemble` 方法) (`torchrl.data.ReplayBuffer` 方法) (`torchrl.data.StackedComposite` 方法) (`torchrl.data.TensorDictPrioritizedReplayBuffer` 方法) (`torchrl.data.TensorDictReplayBuffer` 方法) empty_cache()(`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.TransformedEnv` 方法) encode()(`torchrl.data.Binary` 方法) (`torchrl.data.BinaryDiscreteTensorSpec` 方法) (`torchrl.data.Bounded` 方法) (`torchrl.data.BoundedTensorSpec` 方法) (`torchrl.data.Categorical` 方法) (`torchrl.data.Composite` 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.DiscreteTensorSpec` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.LazyStackedTensorSpec` 方法) (`torchrl.data.MultiCategorical` 方法) (`torchrl.data.MultiDiscreteTensorSpec` 方法) (`torchrl.data.MultiOneHot` 方法) (`torchrl.data.MultiOneHotDiscreteTensorSpec` 方法) (`torchrl.data.NonTensor` 方法) (`torchrl.data.NonTensorSpec` 方法) (`torchrl.data.OneHot` 方法) (`torchrl.data.OneHotDiscreteTensorSpec` 方法) (`torchrl.data.Stacked` 方法) (`torchrl.data.StackedComposite` 方法) (`torchrl.data.TensorSpec` 方法) (`torchrl.data.Unbounded` 方法) (`torchrl.data.UnboundedContinuous` 方法) (`torchrl.data.UnboundedContinuousTensorSpec` 方法) (`torchrl.data.UnboundedDiscrete` 方法) (`torchrl.data.UnboundedDiscreteTensorSpec` 方法) EndOfLifeTransform(`torchrl.envs.transforms` 中的类) entropy()(`torchrl.modules.OneHotCategorical` 方法) enumerate()(`torchrl.data.Binary` 方法) (`torchrl.data.BinaryDiscreteTensorSpec` 方法) (`torchrl.data.Bounded` 方法) (`torchrl.data.BoundedTensorSpec` 方法) (`torchrl.data.Categorical` 方法) (`torchrl.data.Composite` 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.DiscreteTensorSpec` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.LazyStackedTensorSpec` 方法) (`torchrl.data.MultiCategorical` 方法) (`torchrl.data.MultiDiscreteTensorSpec` 方法) (`torchrl.data.MultiOneHot` 方法) (`torchrl.data.MultiOneHotDiscreteTensorSpec` 方法) (`torchrl.data.NonTensor` 方法) (`torchrl.data.NonTensorSpec` 方法) (`torchrl.data.OneHot` 方法) (`torchrl.data.OneHotDiscreteTensorSpec` 方法) (`torchrl.data.Stacked` 方法) (`torchrl.data.StackedComposite` 方法) (`torchrl.data.TensorSpec` 方法) (`torchrl.data.Unbounded` 方法) (`torchrl.data.UnboundedContinuous` 方法) (`torchrl.data.UnboundedContinuousTensorSpec` 方法) (`torchrl.data.UnboundedDiscrete` 方法) (`torchrl.data.UnboundedDiscreteTensorSpec` 方法) EnvBase(`torchrl.envs` 中的类) EnvCreator(`torchrl.envs` 中的类) EnvMetaData(`torchrl.envs` 中的类) eval()(`torchrl.data.BinaryToDecimal` 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) (`torchrl.envs.transforms.TransformedEnv` 方法) ExcludeTransform(`torchrl.envs.transforms` 中的类) expand()(`torchrl.data.Binary` 方法) (`torchrl.data.BinaryDiscreteTensorSpec` 方法) (`torchrl.data.Bounded` 方法) (`torchrl.data.BoundedTensorSpec` 方法) (`torchrl.data.Categorical` 方法) (`torchrl.data.Composite` 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.DiscreteTensorSpec` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.LazyStackedTensorSpec` 方法) (`torchrl.data.MultiCategorical` 方法) (`torchrl.data.MultiDiscreteTensorSpec` 方法) (`torchrl.data.MultiOneHot` 方法) (`torchrl.data.MultiOneHotDiscreteTensorSpec` 方法) (`torchrl.data.NonTensor` 方法) (`torchrl.data.NonTensorSpec` 方法) (`torchrl.data.OneHot` 方法) (`torchrl.data.OneHotDiscreteTensorSpec` 方法) (`torchrl.data.Stacked` 方法) (`torchrl.data.StackedComposite` 方法) (`torchrl.data.TensorSpec` 方法) (`torchrl.data.Unbounded` 方法) (`torchrl.data.UnboundedContinuous` 方法) (`torchrl.data.UnboundedContinuousTensorSpec` 方法) (`torchrl.data.UnboundedDiscrete` 方法) (`torchrl.data.UnboundedDiscreteTensorSpec` 方法) (`torchrl.modules.Delta` 方法) exploration_type()(在模块 `torchrl.envs.utils` 中) extend()(`torchrl.data.datasets.AtariDQNExperienceReplay` 方法) (`torchrl.data.datasets.BaseDatasetExperienceReplay` 方法) (`torchrl.data.datasets.D4RLExperienceReplay` 方法) (`torchrl.data.datasets.GenDGRLExperienceReplay` 方法) (`torchrl.data.datasets.MinariExperienceReplay` 方法) (`torchrl.data.datasets.OpenMLExperienceReplay` 方法) (`torchrl.data.datasets.OpenXExperienceReplay` 方法) (`torchrl.data.datasets.RobosetExperienceReplay` 方法) (`torchrl.data.datasets.VD4RLExperienceReplay` 方法) (`torchrl.data.MCTSForest` 方法) (`torchrl.data.PrioritizedReplayBuffer` 方法) (`torchrl.data.replay_buffers.ImmutableDatasetWriter` 方法) (`torchrl.data.replay_buffers.ReplayBufferEnsemble` 方法) (`torchrl.data.replay_buffers.RoundRobinWriter` 方法) (`torchrl.data.replay_buffers.TensorDictMaxValueWriter` 方法) (`torchrl.data.replay_buffers.TensorDictRoundRobinWriter` 方法) (`torchrl.data.replay_buffers.Writer` 方法) (`torchrl.data.replay_buffers.WriterEnsemble` 方法) (`torchrl.data.ReplayBuffer` 方法) (`torchrl.data.TensorDictPrioritizedReplayBuffer` 方法) (`torchrl.data.TensorDictReplayBuffer` 方法) extra_repr()(`torchrl.data.BinaryToDecimal` 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) F fake_tensordict()(`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) fields()(`torchrl.data.PairwiseDataset` 类方法) (`torchrl.data.PromptData` 类方法) (`torchrl.data.RewardData` 类方法) (`torchrl.data.Tree` 类方法) FiniteTensorDictCheck(`torchrl.envs.transforms` 中的类) fit()(`torchrl.data.RandomProjectionHash` 方法) Flat2TED(`torchrl.data` 中的类) FlatStorageCheckpointer(`torchrl.data.replay_buffers` 中的类) flatten()(`torchrl.data.Binary` 方法) (`torchrl.data.BinaryDiscreteTensorSpec` 方法) (`torchrl.data.Bounded` 方法) (`torchrl.data.BoundedTensorSpec` 方法) (`torchrl.data.Categorical` 方法) (`torchrl.data.Composite` 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.DiscreteTensorSpec` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.LazyStackedTensorSpec` 方法) (`torchrl.data.MultiCategorical` 方法) (`torchrl.data.MultiDiscreteTensorSpec` 方法) (`torchrl.data.MultiOneHot` 方法) (`torchrl.data.MultiOneHotDiscreteTensorSpec` 方法) (`torchrl.data.NonTensor` 方法) (`torchrl.data.NonTensorSpec` 方法) (`torchrl.data.OneHot` 方法) (`torchrl.data.OneHotDiscreteTensorSpec` 方法) (`torchrl.data.Stacked` 方法) (`torchrl.data.StackedComposite` 方法) (`torchrl.data.TensorSpec` 方法) (`torchrl.data.Unbounded` 方法) (`torchrl.data.UnboundedContinuous` 方法) (`torchrl.data.UnboundedContinuousTensorSpec` 方法) (`torchrl.data.UnboundedDiscrete` 方法) (`torchrl.data.UnboundedDiscreteTensorSpec` 方法) FlattenObservation(`torchrl.envs.transforms` 中的类) float()(`torchrl.data.BinaryToDecimal` 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) forward()(`torchrl.data.BinaryToDecimal` 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.ActionMask` 方法) (`torchrl.envs.transforms.AutoResetTransform` 方法) (`torchrl.envs.transforms.BatchSizeTransform` 方法) (`torchrl.envs.transforms.BurnInTransform` 方法) (`torchrl.envs.transforms.CatFrames` 方法) (`torchrl.envs.transforms.CatTensors` 方法) (`torchrl.envs.transforms.Compose` 方法) (`torchrl.envs.transforms.DeviceCastTransform` 方法) (`torchrl.envs.transforms.DTypeCastTransform` 方法) (`torchrl.envs.transforms.EndOfLifeTransform` 方法) (`torchrl.envs.transforms.ExcludeTransform` 方法) (`torchrl.envs.transforms.FiniteTensorDictCheck` 方法) (`torchrl.envs.transforms.FlattenObservation` 方法) (`torchrl.envs.transforms.FrameSkipTransform` 方法) (`torchrl.envs.transforms.InitTracker` 方法) (`torchrl.envs.transforms.KLRewardTransform` 方法) (`torchrl.envs.transforms.PinMemoryTransform` 方法) (`torchrl.envs.transforms.RandomCropTensorDict` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) (`torchrl.envs.transforms.RemoveEmptySpecs` 方法) (`torchrl.envs.transforms.RenameTransform` 方法) (`torchrl.envs.transforms.Reward2GoTransform` 方法) (`torchrl.envs.transforms.RewardSum` 方法) (`torchrl.envs.transforms.SelectTransform` 方法) (`torchrl.envs.transforms.Stack` 方法) (`torchrl.envs.transforms.StepCounter` 方法) (`torchrl.envs.transforms.TargetReturn` 方法) (`torchrl.envs.transforms.TensorDictPrimer` 方法) (`torchrl.envs.transforms.TimeMaxPool` 方法) (`torchrl.envs.transforms.TrajCounter` 方法) (`torchrl.envs.transforms.Transform` 方法) (`torchrl.envs.transforms.VC1Transform` 方法) (`torchrl.envs.transforms.VecGymEnvTransform` 方法) (`torchrl.envs.transforms.VecNorm` 方法) (`torchrl.envs.transforms.VIPRewardTransform` 方法) (`torchrl.modules.AdditiveGaussianModule` 方法) (`torchrl.modules.BatchRenorm1d` 方法) (`torchrl.modules.ConsistentDropout` 方法) (`torchrl.modules.ConsistentDropoutModule` 方法) (`torchrl.modules.Conv3dNet` 方法) (`torchrl.modules.ConvNet` 方法) (`torchrl.modules.DdpgCnnActor` 方法) (`torchrl.modules.DdpgCnnQNet` 方法) (`torchrl.modules.DdpgMlpActor` 方法) (`torchrl.modules.DdpgMlpQNet` 方法) (`torchrl.modules.DecisionTransformer` 方法) (`torchrl.modules.DistributionalDQNnet` 方法) (`torchrl.modules.DreamerActor` 方法) (`torchrl.modules.DTActor` 方法) (`torchrl.modules.DuelingCnnDQNet` 方法) (`torchrl.modules.EGreedyModule` 方法) (`torchrl.modules.GRU` 方法) (`torchrl.modules.GRUCell` 方法) (`torchrl.modules.GRUModule` 方法) (`torchrl.modules.LSTM` 方法) (`torchrl.modules.LSTMCell` 方法) (`torchrl.modules.LSTMModule` 方法) (`torchrl.modules.MLP` 方法) (`torchrl.modules.MPCPlannerBase` 方法) (`torchrl.modules.MultiAgentNetBase` 方法) (`torchrl.modules.ObsDecoder` 方法) (`torchrl.modules.ObsEncoder` 方法) (`torchrl.modules.OnlineDTActor` 方法) (`torchrl.modules.OrnsteinUhlenbeckProcessModule` 方法) (`torchrl.modules.RSSMPosterior` 方法) (`torchrl.modules.RSSMPrior` 方法) (`torchrl.modules.SqueezeLayer` 方法) (`torchrl.modules.tensordict_module.DecisionTransformerInferenceWrapper` 方法) (`torchrl.modules.tensordict_module.DistributionalQValueModule` 方法) (`torchrl.modules.tensordict_module.MultiStepActorWrapper` 方法) (`torchrl.modules.tensordict_module.QValueModule` 方法) (`torchrl.modules.tensordict_module.TanhModule` 方法) (`torchrl.modules.utils.biased_softplus` 方法) (`torchrl.modules.VmapModule` 方法) (`torchrl.objectives.A2CLoss` 方法) (`torchrl.objectives.ClipPPOLoss` 方法) (`torchrl.objectives.CQLLoss` 方法) (`torchrl.objectives.CrossQLoss` 方法) (`torchrl.objectives.DDPGLoss` 方法) (`torchrl.objectives.DiscreteCQLLoss` 方法) (`torchrl.objectives.DiscreteIQLLoss` 方法) (`torchrl.objectives.DiscreteSACLoss` 方法) (`torchrl.objectives.DistributionalDQNLoss` 方法) (`torchrl.objectives.DQNLoss` 方法) (`torchrl.objectives.DreamerActorLoss` 方法) (`torchrl.objectives.DreamerModelLoss` 方法) (`torchrl.objectives.DreamerValueLoss` 方法) (`torchrl.objectives.DTLoss` 方法) (`torchrl.objectives.GAILLoss` 方法) (`torchrl.objectives.IQLLoss` 方法) (`torchrl.objectives.KLPENPPOLoss` 方法) (`torchrl.objectives.LossModule` 方法) (`torchrl.objectives.multiagent.QMixerLoss` 方法) (`torchrl.objectives.OnlineDTLoss` 方法) (`torchrl.objectives.PPOLoss` 方法) (`torchrl.objectives.REDQLoss` 方法) (`torchrl.objectives.ReinforceLoss` 方法) (`torchrl.objectives.SACLoss` 方法) (`torchrl.objectives.TD3BCLoss` 方法) (`torchrl.objectives.TD3Loss` 方法) (`torchrl.objectives.value.GAE` 方法) (`torchrl.objectives.value.TD0Estimator` 方法) (`torchrl.objectives.value.TD1Estimator` 方法) (`torchrl.objectives.value.TDLambdaEstimator` 方法) (`torchrl.objectives.value.ValueEstimatorBase` 方法) FrameSkipTransform(`torchrl.envs.transforms` 中的类) freeze()(`torchrl.envs.transforms.VecNorm` 方法) from_dataset()(`torchrl.data.PairwiseDataset` 类方法) (`torchrl.data.PromptData` 类方法) from_stateful_net()(`torchrl.modules.MultiAgentNetBase` 方法) (`torchrl.objectives.LossModule` 方法) from_tensordict()(`torchrl.data.PairwiseDataset` 类方法) (`torchrl.data.PromptData` 类方法) (`torchrl.data.RewardData` 类方法) (`torchrl.data.Tree` 类方法) from_tensordict_pair()(`torchrl.data.TensorDictMap` 类方法) frozen_copy()(`torchrl.envs.transforms.VecNorm` 方法) full_action_spec(`torchrl.data.Tree` 属性) (`torchrl.envs.ChessEnv` 属性) (`torchrl.envs.EnvBase` 属性) (`torchrl.envs.GymLikeEnv` 属性) (`torchrl.envs.LLMHashingEnv` 属性) (`torchrl.envs.ParallelEnv` 属性) (`torchrl.envs.PendulumEnv` 属性) (`torchrl.envs.SerialEnv` 属性) (`torchrl.envs.TicTacToeEnv` 属性) full_action_spec_unbatched(`torchrl.envs.ChessEnv` 属性) (`torchrl.envs.EnvBase` 属性) (`torchrl.envs.GymLikeEnv` 属性) (`torchrl.envs.LLMHashingEnv` 属性) (`torchrl.envs.ParallelEnv` 属性) (`torchrl.envs.PendulumEnv` 属性) (`torchrl.envs.SerialEnv` 属性) (`torchrl.envs.TicTacToeEnv` 属性) full_done_spec(`torchrl.data.Tree` 属性) (`torchrl.envs.ChessEnv` 属性) (`torchrl.envs.EnvBase` 属性) (`torchrl.envs.GymLikeEnv` 属性) (`torchrl.envs.LLMHashingEnv` 属性) (`torchrl.envs.ParallelEnv` 属性) (`torchrl.envs.PendulumEnv` 属性) (`torchrl.envs.SerialEnv` 属性) (`torchrl.envs.TicTacToeEnv` 属性) full_done_spec_unbatched(`torchrl.envs.ChessEnv` 属性) (`torchrl.envs.EnvBase` 属性) (`torchrl.envs.GymLikeEnv` 属性) (`torchrl.envs.LLMHashingEnv` 属性) (`torchrl.envs.ParallelEnv` 属性) (`torchrl.envs.PendulumEnv` 属性) (`torchrl.envs.SerialEnv` 属性) (`torchrl.envs.TicTacToeEnv` 属性) full_observation_spec(`torchrl.data.Tree` 属性) full_observation_spec_unbatched(`torchrl.envs.ChessEnv` 属性) (`torchrl.envs.EnvBase` 属性) (`torchrl.envs.GymLikeEnv` 属性) (`torchrl.envs.LLMHashingEnv` 属性) (`torchrl.envs.ParallelEnv` 属性) (`torchrl.envs.PendulumEnv` 属性) (`torchrl.envs.SerialEnv` 属性) (`torchrl.envs.TicTacToeEnv` 属性) full_reward_spec(`torchrl.data.Tree` 属性) (`torchrl.envs.ChessEnv` 属性) (`torchrl.envs.EnvBase` 属性) (`torchrl.envs.GymLikeEnv` 属性) (`torchrl.envs.LLMHashingEnv` 属性) (`torchrl.envs.ParallelEnv` 属性) (`torchrl.envs.PendulumEnv` 属性) (`torchrl.envs.SerialEnv` 属性) (`torchrl.envs.TicTacToeEnv` 属性) full_reward_spec_unbatched(`torchrl.envs.ChessEnv` 属性) (`torchrl.envs.EnvBase` 属性) (`torchrl.envs.GymLikeEnv` 属性) (`torchrl.envs.LLMHashingEnv` 属性) (`torchrl.envs.ParallelEnv` 属性) (`torchrl.envs.PendulumEnv` 属性) (`torchrl.envs.SerialEnv` 属性) (`torchrl.envs.TicTacToeEnv` 属性) full_state_spec(`torchrl.data.Tree` 属性) (`torchrl.envs.ChessEnv` 属性) (`torchrl.envs.EnvBase` 属性) (`torchrl.envs.GymLikeEnv` 属性) (`torchrl.envs.LLMHashingEnv` 属性) (`torchrl.envs.ParallelEnv` 属性) (`torchrl.envs.PendulumEnv` 属性) (`torchrl.envs.SerialEnv` 属性) (`torchrl.envs.TicTacToeEnv` 属性) full_state_spec_unbatched(`torchrl.envs.ChessEnv` 属性) (`torchrl.envs.EnvBase` 属性) (`torchrl.envs.GymLikeEnv` 属性) (`torchrl.envs.LLMHashingEnv` 属性) (`torchrl.envs.ParallelEnv` 属性) (`torchrl.envs.PendulumEnv` 属性) (`torchrl.envs.SerialEnv` 属性) (`torchrl.envs.TicTacToeEnv` 属性) fully_expanded()(`torchrl.data.Tree` 方法) functional(`torchrl.objectives.A2CLoss` 属性) (`torchrl.objectives.LossModule` 属性) (`torchrl.objectives.PPOLoss` 属性) (`torchrl.objectives.ReinforceLoss` 属性) G GAE(`torchrl.objectives.value` 中的类) GAILLoss(`torchrl.objectives` 中的类) gen_params()(`torchrl.envs.PendulumEnv` 静态方法) GenDGRLExperienceReplay(`torchrl.data.datasets` 中的类) generalized_advantage_estimate(`torchrl.objectives.value.functional` 中的类) generate()(`torchrl.data.RolloutFromModel` 方法) generate_exp_name()(在模块 `torchrl.record.loggers` 中) get()(`torchrl.data.Composite` 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.PairwiseDataset` 方法) (`torchrl.data.PromptData` 方法) (`torchrl.data.RewardData` 方法) (`torchrl.data.StackedComposite` 方法) (`torchrl.data.Tree` 方法) get_available_libraries()(在模块 `torchrl.envs.utils` 中) get_buffer()(`torchrl.data.BinaryToDecimal` 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) get_class_that_defined_method()(`torchrl._utils.implement_for` 静态方法) get_critic_operator()(`torchrl.modules.tensordict_module.ActorCriticOperator` 方法) get_dataloader(`torchrl.data` 中的类) get_extra_state()(`torchrl.data.BinaryToDecimal` 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) (`torchrl.envs.transforms.VecNorm` 方法) get_insert_index()(`torchrl.data.replay_buffers.TensorDictMaxValueWriter` 方法) get_keys_from_env()(`torchrl.data.MCTSForest` 方法) get_legal_moves()(`torchrl.envs.ChessEnv` 方法) get_logger()(在模块 `torchrl.record.loggers` 中) get_mode()(`torchrl.modules.TanhNormal` 方法) get_parameter()(`torchrl.data.BinaryToDecimal` 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) get_policy_head()(`torchrl.modules.tensordict_module.ActorCriticOperator` 方法) (`torchrl.modules.tensordict_module.ActorCriticWrapper` 方法) (`torchrl.modules.tensordict_module.ActorValueOperator` 方法) get_policy_operator()(`torchrl.modules.tensordict_module.ActorCriticWrapper` 方法) (`torchrl.modules.tensordict_module.ActorValueOperator` 方法) get_primers_from_module(`torchrl.modules.utils` 中的类) get_reward_operator()(`torchrl.modules.tensordict_module.WorldModelWrapper` 方法) get_stateful_net()(`torchrl.modules.MultiAgentNetBase` 方法) (`torchrl.objectives.LossModule` 方法) get_stats_random_rollout()(在模块 `torchrl.trainers.helpers` 中) get_submodule()(`torchrl.data.BinaryToDecimal` 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) get_transition_model_operator()(`torchrl.modules.tensordict_module.WorldModelWrapper` 方法) get_value_head()(`torchrl.modules.tensordict_module.ActorCriticOperator` 方法) (`torchrl.modules.tensordict_module.ActorCriticWrapper` 方法) (`torchrl.modules.tensordict_module.ActorValueOperator` 方法) get_value_operator()(`torchrl.modules.tensordict_module.ActorCriticOperator` 方法) (`torchrl.modules.tensordict_module.ActorCriticWrapper` 方法) (`torchrl.modules.tensordict_module.ActorValueOperator` 方法) get_vertex_by_hash()(`torchrl.data.Tree` 方法) get_vertex_by_id()(`torchrl.data.Tree` 方法) GrayScale(`torchrl.envs.transforms` 中的类) group_optimizers(`torchrl.objectives` 中的类) GRU(`torchrl.modules` 中的类) GRUCell(`torchrl.modules` 中的类) GRUModule(`torchrl.modules` 中的类) gSDENoise(`torchrl.envs.transforms` 中的类) gym_backend()(在模块 `torchrl.envs` 中) GymEnv()(在模块 `torchrl.envs` 中) GymLikeEnv(`torchrl.envs` 中的类) GymWrapper()(在模块 `torchrl.envs` 中) H H5Combine(`torchrl.data` 中的类) H5Split(`torchrl.data` 中的类) H5StorageCheckpointer(`torchrl.data.replay_buffers` 中的类) HabitatEnv()(在模块 `torchrl.envs` 中) half()(`torchrl.data.BinaryToDecimal` 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) HardUpdate(`torchrl.objectives` 中的类) Hash(`torchrl.envs.transforms` 中的类) HashToInt(`torchrl.data` 中的类) hold_out_net(`torchrl.objectives` 中的类) hold_out_params(`torchrl.objectives` 中的类) I ImmutableDatasetWriter(`torchrl.data.replay_buffers` 中的类) implement_for(`torchrl._utils` 中的类) implements_for_spec()(`torchrl.data.Binary` 类方法) (`torchrl.data.BinaryDiscreteTensorSpec` 类方法) (`torchrl.data.Bounded` 类方法) (`torchrl.data.BoundedTensorSpec` 类方法) (`torchrl.data.Categorical` 类方法) (`torchrl.data.Composite` 类方法) (`torchrl.data.CompositeSpec` 类方法) (`torchrl.data.DiscreteTensorSpec` 类方法) (`torchrl.data.LazyStackedCompositeSpec` 类方法) (`torchrl.data.LazyStackedTensorSpec` 类方法) (`torchrl.data.MultiCategorical` 类方法) (`torchrl.data.MultiDiscreteTensorSpec` 类方法) (`torchrl.data.MultiOneHot` 类方法) (`torchrl.data.MultiOneHotDiscreteTensorSpec` 类方法) (`torchrl.data.NonTensor` 类方法) (`torchrl.data.NonTensorSpec` 类方法) (`torchrl.data.OneHot` 类方法) (`torchrl.data.OneHotDiscreteTensorSpec` 类方法) (`torchrl.data.Stacked` 类方法) (`torchrl.data.StackedComposite` 类方法) (`torchrl.data.TensorSpec` 类方法) (`torchrl.data.Unbounded` 类方法) (`torchrl.data.UnboundedContinuous` 类方法) (`torchrl.data.UnboundedContinuousTensorSpec` 类方法) (`torchrl.data.UnboundedDiscrete` 类方法) (`torchrl.data.UnboundedDiscreteTensorSpec` 类方法) import_module()(`torchrl._utils.implement_for` 类方法) IndependentNormal(`torchrl.modules` 中的类) index()(`torchrl.data.Binary` 方法) (`torchrl.data.BinaryDiscreteTensorSpec` 方法) (`torchrl.data.Bounded` 方法) (`torchrl.data.BoundedTensorSpec` 方法) (`torchrl.data.Categorical` 方法) (`torchrl.data.Composite` 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.DiscreteTensorSpec` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.LazyStackedTensorSpec` 方法) (`torchrl.data.MultiCategorical` 方法) (`torchrl.data.MultiDiscreteTensorSpec` 方法) (`torchrl.data.MultiOneHot` 方法) (`torchrl.data.MultiOneHotDiscreteTensorSpec` 方法) (`torchrl.data.NonTensor` 方法) (`torchrl.data.NonTensorSpec` 方法) (`torchrl.data.OneHot` 方法) (`torchrl.data.OneHotDiscreteTensorSpec` 方法) (`torchrl.data.Stacked` 方法) (`torchrl.data.StackedComposite` 方法) (`torchrl.data.TensorSpec` 方法) (`torchrl.data.Unbounded` 方法) (`torchrl.data.UnboundedContinuous` 方法) (`torchrl.data.UnboundedContinuousTensorSpec` 方法) (`torchrl.data.UnboundedDiscrete` 方法) (`torchrl.data.UnboundedDiscreteTensorSpec` 方法) init_key(`torchrl.modules.tensordict_module.MultiStepActorWrapper` 属性) init_stats()(`torchrl.envs.transforms.ObservationNorm` 方法) initialize_parameters()(`torchrl.modules.NoisyLazyLinear` 方法) InitTracker(`torchrl.envs.transforms` 中的类) input_spec(`torchrl.envs.ChessEnv` 属性) (`torchrl.envs.EnvBase` 属性) (`torchrl.envs.GymLikeEnv` 属性) (`torchrl.envs.LLMHashingEnv` 属性) (`torchrl.envs.ParallelEnv` 属性) (`torchrl.envs.PendulumEnv` 属性) (`torchrl.envs.SerialEnv` 属性) (`torchrl.envs.TicTacToeEnv` 属性) (`torchrl.envs.transforms.TransformedEnv` 属性) input_spec_unbatched(`torchrl.envs.ChessEnv` 属性) (`torchrl.envs.EnvBase` 属性) (`torchrl.envs.GymLikeEnv` 属性) (`torchrl.envs.LLMHashingEnv` 属性) (`torchrl.envs.ParallelEnv` 属性) (`torchrl.envs.PendulumEnv` 属性) (`torchrl.envs.SerialEnv` 属性) (`torchrl.envs.TicTacToeEnv` 属性) insert()(`torchrl.envs.transforms.Compose` 方法) insert_transform()(`torchrl.data.datasets.AtariDQNExperienceReplay` 方法) (`torchrl.data.datasets.BaseDatasetExperienceReplay` 方法) (`torchrl.data.datasets.D4RLExperienceReplay` 方法) (`torchrl.data.datasets.GenDGRLExperienceReplay` 方法) (`torchrl.data.datasets.MinariExperienceReplay` 方法) (`torchrl.data.datasets.OpenMLExperienceReplay` 方法) (`torchrl.data.datasets.OpenXExperienceReplay` 方法) (`torchrl.data.datasets.RobosetExperienceReplay` 方法) (`torchrl.data.datasets.VD4RLExperienceReplay` 方法) (`torchrl.data.PrioritizedReplayBuffer` 方法) (`torchrl.data.replay_buffers.ReplayBufferEnsemble` 方法) (`torchrl.data.ReplayBuffer` 方法) (`torchrl.data.TensorDictPrioritizedReplayBuffer` 方法) (`torchrl.data.TensorDictReplayBuffer` 方法) (`torchrl.envs.transforms.AutoResetEnv` 方法) (`torchrl.envs.transforms.TransformedEnv` 方法) inv_softplus(`torchrl.modules.utils` 中的类) ipu()(`torchrl.data.BinaryToDecimal` 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) IQLLoss(`torchrl.objectives` 中的类) is_empty()(`torchrl.data.Composite` 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.StackedComposite` 方法) is_in()(`torchrl.data.Binary` 方法) (`torchrl.data.BinaryDiscreteTensorSpec` 方法) (`torchrl.data.Bounded` 方法) (`torchrl.data.BoundedTensorSpec` 方法) (`torchrl.data.Categorical` 方法) (`torchrl.data.Composite` 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.DiscreteTensorSpec` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.LazyStackedTensorSpec` 方法) (`torchrl.data.MultiCategorical` 方法) (`torchrl.data.MultiDiscreteTensorSpec` 方法) (`torchrl.data.MultiOneHot` 方法) (`torchrl.data.MultiOneHotDiscreteTensorSpec` 方法) (`torchrl.data.NonTensor` 方法) (`torchrl.data.NonTensorSpec` 方法) (`torchrl.data.OneHot` 方法) (`torchrl.data.OneHotDiscreteTensorSpec` 方法) (`torchrl.data.Stacked` 方法) (`torchrl.data.StackedComposite` 方法) (`torchrl.data.TensorSpec` 方法) (`torchrl.data.Unbounded` 方法) (`torchrl.data.UnboundedContinuous` 方法) (`torchrl.data.UnboundedContinuousTensorSpec` 方法) (`torchrl.data.UnboundedDiscrete` 方法) (`torchrl.data.UnboundedDiscreteTensorSpec` 方法) is_spec_locked(`torchrl.envs.ChessEnv` 属性) (`torchrl.envs.EnvBase` 属性) (`torchrl.envs.GymLikeEnv` 属性) (`torchrl.envs.LLMHashingEnv` 属性) (`torchrl.envs.ParallelEnv` 属性) (`torchrl.envs.PendulumEnv` 属性) (`torchrl.envs.SerialEnv` 属性) (`torchrl.envs.TicTacToeEnv` 属性) is_tdmodule_compatible()(`torchrl.data.QueryModule` 静态方法) (`torchrl.data.TensorDictMap` 静态方法) is_terminal(`torchrl.data.Tree` 属性) IsaacGymEnv()(在模块 `torchrl.envs` 中) IsaacGymWrapper()(在模块 `torchrl.envs` 中) items()(`torchrl.data.Composite` 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.StackedComposite` 方法) iterator()(`torchrl.collectors.SyncDataCollector` 方法) J JumanjiEnv()(在模块 `torchrl.envs` 中) JumanjiWrapper()(在模块 `torchrl.envs` 中) K keys()(`torchrl.data.Composite` 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.StackedComposite` 方法) KLPENPPOLoss(`torchrl.objectives` 中的类) KLRewardTransform(`torchrl.envs.transforms` 中的类) L LazyMemmapStorage(`torchrl.data.replay_buffers` 中的类) LazyStackedCompositeSpec(`torchrl.data` 中的类) LazyStackedTensorSpec(`torchrl.data` 中的类) LazyStackStorage(`torchrl.data.replay_buffers` 中的类) LazyTensorStorage(`torchrl.data.replay_buffers` 中的类) LineariseRewards(`torchrl.envs.transforms` 中的类) ListStorage(`torchrl.data.replay_buffers` 中的类) ListStorageCheckpointer(`torchrl.data.replay_buffers` 中的类) LLMHashingEnv(`torchrl.envs` 中的类) LMHeadActorValueOperator(`torchrl.modules.tensordict_module` 中的类) load()(`torchrl.data.datasets.AtariDQNExperienceReplay` 方法) (`torchrl.data.datasets.BaseDatasetExperienceReplay` 方法) (`torchrl.data.datasets.D4RLExperienceReplay` 方法) (`torchrl.data.datasets.GenDGRLExperienceReplay` 方法) (`torchrl.data.datasets.MinariExperienceReplay` 方法) (`torchrl.data.datasets.OpenMLExperienceReplay` 方法) (`torchrl.data.datasets.OpenXExperienceReplay` 方法) (`torchrl.data.datasets.RobosetExperienceReplay` 方法) (`torchrl.data.datasets.VD4RLExperienceReplay` 方法) (`torchrl.data.PairwiseDataset` 类方法) (`torchrl.data.PrioritizedReplayBuffer` 方法) (`torchrl.data.PromptData` 类方法) (`torchrl.data.replay_buffers.LazyMemmapStorage` 方法) (`torchrl.data.replay_buffers.LazyStackStorage` 方法) (`torchrl.data.replay_buffers.LazyTensorStorage` 方法) (`torchrl.data.replay_buffers.ListStorage` 方法) (`torchrl.data.replay_buffers.ReplayBufferEnsemble` 方法) (`torchrl.data.replay_buffers.Storage` 方法) (`torchrl.data.replay_buffers.StorageEnsemble` 方法) (`torchrl.data.replay_buffers.TensorStorage` 方法) (`torchrl.data.ReplayBuffer` 方法) (`torchrl.data.RewardData` 类方法) (`torchrl.data.TensorDictPrioritizedReplayBuffer` 方法) (`torchrl.data.TensorDictReplayBuffer` 方法) (`torchrl.data.TokenizedDatasetLoader` 方法) (`torchrl.data.Tree` 类方法) load_()(`torchrl.data.PairwiseDataset` 方法) (`torchrl.data.PromptData` 方法) (`torchrl.data.RewardData` 方法) (`torchrl.data.Tree` 方法) load_from_file()(`torchrl.trainers.Trainer` 方法) load_memmap()(`torchrl.data.PairwiseDataset` 类方法) (`torchrl.data.PromptData` 类方法) (`torchrl.data.RewardData` 类方法) (`torchrl.data.Tree` 类方法) load_state_dict()(`torchrl.collectors.aSyncDataCollector` 方法) (`torchrl.collectors.distributed.RayCollector` 方法) (`torchrl.collectors.MultiaSyncDataCollector` 方法) (`torchrl.collectors.MultiSyncDataCollector` 方法) (`torchrl.collectors.SyncDataCollector` 方法) (`torchrl.data.BinaryToDecimal` 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.PairwiseDataset` 方法) (`torchrl.data.PromptData` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.RewardData` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.data.Tree` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) (`torchrl.envs.transforms.TrajCounter` 方法) (`torchrl.envs.transforms.TransformedEnv` 方法) (`torchrl.objectives.CrossQLoss` 方法) (`torchrl.objectives.SACLoss` 方法) loads()(`torchrl.data.datasets.AtariDQNExperienceReplay` 方法) (`torchrl.data.datasets.BaseDatasetExperienceReplay` 方法) (`torchrl.data.datasets.D4RLExperienceReplay` 方法) (`torchrl.data.datasets.GenDGRLExperienceReplay` 方法) (`torchrl.data.datasets.MinariExperienceReplay` 方法) (`torchrl.data.datasets.OpenMLExperienceReplay` 方法) (`torchrl.data.datasets.OpenXExperienceReplay` 方法) (`torchrl.data.datasets.RobosetExperienceReplay` 方法) (`torchrl.data.datasets.VD4RLExperienceReplay` 方法) (`torchrl.data.PrioritizedReplayBuffer` 方法) (`torchrl.data.replay_buffers.ReplayBufferEnsemble` 方法) (`torchrl.data.ReplayBuffer` 方法) (`torchrl.data.TensorDictPrioritizedReplayBuffer` 方法) (`torchrl.data.TensorDictReplayBuffer` 方法) loc(`torchrl.envs.transforms.VecNorm` 属性) local_policy()(`torchrl.collectors.distributed.RayCollector` 方法) lock_()(`torchrl.data.Composite` 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.StackedComposite` 方法) log_prob()(`torchrl.modules.Delta` 方法) (`torchrl.modules.MaskedCategorical` 方法) (`torchrl.modules.MaskedOneHotCategorical` 方法) (`torchrl.modules.OneHotCategorical` 方法) (`torchrl.modules.TruncatedNormal` 方法) Logger()(在模块 `torchrl.record.loggers` 中) logprobs_of_labels()(`torchrl.data.RolloutFromModel` 静态方法) LogScalar(`torchrl.trainers` 中的类) LogValidationReward(`torchrl.trainers` 中的类) loss_critic() (torchrl.objectives.A2CLoss 方法) (`torchrl.objectives.PPOLoss` 方法) loss_value_diff() (torchrl.objectives.IQLLoss 静态方法) LossModule (在 torchrl.objectives 中的类) LSTM (在 torchrl.modules 中的类) LSTMCell (在 torchrl.modules 中的类) LSTMModule (在 torchrl.modules 中的类) M make_collector_offpolicy() (在模块 torchrl.trainers.helpers 中) make_collector_onpolicy() (在模块 torchrl.trainers.helpers 中) make_composite_from_td() (在模块 torchrl.envs.utils 中) make_cudnn_based() (torchrl.modules.GRUModule 方法) (`torchrl.modules.LSTMModule` 方法) make_dqn_loss() (在模块 torchrl.trainers.helpers 中) make_neg_dim() (torchrl.data.Binary 方法) (`torchrl.data.BinaryDiscreteTensorSpec` 方法) (`torchrl.data.Bounded` 方法) (`torchrl.data.BoundedTensorSpec` 方法) (`torchrl.data.Categorical` 方法) (`torchrl.data.Composite` 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.DiscreteTensorSpec` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.LazyStackedTensorSpec` 方法) (`torchrl.data.MultiCategorical` 方法) (`torchrl.data.MultiDiscreteTensorSpec` 方法) (`torchrl.data.MultiOneHot` 方法) (`torchrl.data.MultiOneHotDiscreteTensorSpec` 方法) (`torchrl.data.NonTensor` 方法) (`torchrl.data.NonTensorSpec` 方法) (`torchrl.data.OneHot` 方法) (`torchrl.data.OneHotDiscreteTensorSpec` 方法) (`torchrl.data.Stacked` 方法) (`torchrl.data.StackedComposite` 方法) (`torchrl.data.TensorSpec` 方法) (`torchrl.data.Unbounded` 方法) (`torchrl.data.UnboundedContinuous` 方法) (`torchrl.data.UnboundedContinuousTensorSpec` 方法) (`torchrl.data.UnboundedDiscrete` 方法) (`torchrl.data.UnboundedDiscreteTensorSpec` 方法) make_node() (torchrl.data.Tree 类方法) make_noload_model() (torchrl.envs.transforms.VC1Transform 类方法) make_python_based() (torchrl.modules.GRUModule 方法) (`torchrl.modules.LSTMModule` 方法) make_rb_transform_and_sampler() (torchrl.envs.transforms.CatFrames 方法) make_replay_buffer() (在模块 torchrl.trainers.helpers 中) make_target_updater() (在模块 torchrl.trainers.helpers 中) make_tensordict() (torchrl.envs.LLMHashingEnv 方法) make_tensordict_primer() (torchrl.modules.ConsistentDropoutModule 方法) (torchrl.modules.GRUModule 方法), [1] (torchrl.modules.LSTMModule 方法), [1] make_trainer() (在模块 torchrl.trainers.helpers 中) make_value_estimator() (torchrl.objectives.A2CLoss 方法) (`torchrl.objectives.CQLLoss` 方法) (`torchrl.objectives.CrossQLoss` 方法) (`torchrl.objectives.DDPGLoss` 方法) (`torchrl.objectives.DiscreteCQLLoss` 方法) (`torchrl.objectives.DiscreteSACLoss` 方法) (`torchrl.objectives.DistributionalDQNLoss` 方法) (`torchrl.objectives.DQNLoss` 方法) (`torchrl.objectives.DreamerActorLoss` 方法) (`torchrl.objectives.IQLLoss` 方法) (`torchrl.objectives.LossModule` 方法) (`torchrl.objectives.multiagent.QMixerLoss` 方法) (`torchrl.objectives.PPOLoss` 方法) (`torchrl.objectives.REDQLoss` 方法) (`torchrl.objectives.ReinforceLoss` 方法) (`torchrl.objectives.SACLoss` 方法) (`torchrl.objectives.TD3BCLoss` 方法) (`torchrl.objectives.TD3Loss` 方法) make_variant() (torchrl.envs.EnvCreator 方法) mappings (在 torchrl.modules.utils 中的类) MarlGroupMapType() (在模块 torchrl.envs 中) mask_context() (torchrl.modules.tensordict_module.DecisionTransformerInferenceWrapper 方法) MaskedCategorical (在 torchrl.modules 中的类) MaskedOneHotCategorical (在 torchrl.modules 中的类) max_length() (torchrl.data.Tree 方法) maybe_init_target_entropy() (torchrl.objectives.CrossQLoss 方法) maybe_reset() (torchrl.envs.ChessEnv 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) MCTSForest (在 torchrl.data 中的类) mean (torchrl.modules.Delta 属性) (torchrl.modules.TanhDelta 属性) (torchrl.modules.TanhNormal 属性) MeltingpotEnv() (在模块 torchrl.envs 中) MeltingpotWrapper() (在模块 torchrl.envs 中) memmap() (torchrl.data.PairwiseDataset 方法) (`torchrl.data.PromptData` 方法) (`torchrl.data.RewardData` 方法) (`torchrl.data.Tree` 方法) memmap_() (torchrl.data.PairwiseDataset 方法) (`torchrl.data.PromptData` 方法) (`torchrl.data.RewardData` 方法) (`torchrl.data.Tree` 方法) memmap_like() (torchrl.data.PairwiseDataset 方法) (`torchrl.data.PromptData` 方法) (`torchrl.data.RewardData` 方法) (`torchrl.data.Tree` 方法) memmap_refresh_() (torchrl.data.PairwiseDataset 方法) (`torchrl.data.PromptData` 方法) (`torchrl.data.RewardData` 方法) (`torchrl.data.Tree` 方法) MinariExperienceReplay (在 torchrl.data.datasets 中的类) mix() (torchrl.modules.QMixer 方法) (torchrl.modules.VDNMixer 方法) MLFlowLogger() (在模块 torchrl.record.loggers.mlflow 中) MLP (在 torchrl.modules 中的类) mode (torchrl.modules.Delta 属性) (torchrl.modules.IndependentNormal 属性) (torchrl.modules.MaskedOneHotCategorical 属性) (torchrl.modules.OneHotCategorical 属性) (torchrl.modules.TanhDelta 属性) (torchrl.modules.TanhNormal 属性) (torchrl.modules.TruncatedNormal 属性) ModelBasedEnvBase() (在模块 torchrl.envs 中) module_set() (torchrl._utils.implement_for 方法) modules() (torchrl.data.BinaryToDecimal 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) MOGymEnv() (在模块 torchrl.envs 中) MOGymWrapper() (在模块 torchrl.envs 中) MPCPlannerBase (在 torchrl.modules 中的类) MPPIPlanner (在 torchrl.modules 中的类) mtia() (torchrl.data.BinaryToDecimal 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) MultiAgentConvNet (在 torchrl.modules 中的类) MultiAgentMLP (在 torchrl.modules 中的类) MultiAgentNetBase (在 torchrl.modules 中的类) MultiaSyncDataCollector (在 torchrl.collectors 中的类) MultiCategorical (在 torchrl.data 中的类) MultiDiscreteTensorSpec (在 torchrl.data 中的类) MultiOneHot (在 torchrl.data 中的类) MultiOneHotDiscreteTensorSpec (在 torchrl.data 中的类) MultiStep (在 torchrl.data 中的类) MultiStepActorWrapper (在 torchrl.modules.tensordict_module 中的类) MultiStepTransform (在 torchrl.envs.transforms.rb_transforms 中的类) MultiSyncDataCollector (在 torchrl.collectors 中的类) MultiThreadedEnv() (在模块 torchrl.envs 中) MultiThreadedEnvWrapper() (在模块 torchrl.envs 中) N n_steps (torchrl.envs.transforms.rb_transforms.MultiStepTransform 属性) named_buffers() (torchrl.data.BinaryToDecimal 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) named_children() (torchrl.data.BinaryToDecimal 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) named_modules() (torchrl.data.BinaryToDecimal 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) named_parameters() (torchrl.data.BinaryToDecimal 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) (`torchrl.objectives.LossModule` 方法) ndim (torchrl.data.Binary 属性) (torchrl.data.BinaryDiscreteTensorSpec 属性) (`torchrl.data.Bounded` 属性) (`torchrl.data.BoundedTensorSpec` 属性) (torchrl.data.Categorical 属性) (`torchrl.data.Composite` 属性) (`torchrl.data.CompositeSpec` 属性) (torchrl.data.DiscreteTensorSpec 属性) (`torchrl.data.LazyStackedCompositeSpec` 属性) (`torchrl.data.LazyStackedTensorSpec` 属性) (torchrl.data.MultiCategorical 属性) (torchrl.data.MultiDiscreteTensorSpec 属性) (torchrl.data.MultiOneHot 属性) (torchrl.data.MultiOneHotDiscreteTensorSpec 属性) (`torchrl.data.NonTensor` 属性) (`torchrl.data.NonTensorSpec` 属性) (torchrl.data.OneHot 属性) (torchrl.data.OneHotDiscreteTensorSpec 属性) (`torchrl.data.Stacked` 属性) (`torchrl.data.StackedComposite` 属性) (`torchrl.data.TensorSpec` 属性) (`torchrl.data.Unbounded` 属性) (`torchrl.data.UnboundedContinuous` 属性) (`torchrl.data.UnboundedContinuousTensorSpec` 属性) (`torchrl.data.UnboundedDiscrete` 属性) (`torchrl.data.UnboundedDiscreteTensorSpec` 属性) ndimension() (torchrl.data.Binary 方法) (`torchrl.data.BinaryDiscreteTensorSpec` 方法) (`torchrl.data.Bounded` 方法) (`torchrl.data.BoundedTensorSpec` 方法) (`torchrl.data.Categorical` 方法) (`torchrl.data.Composite` 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.DiscreteTensorSpec` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.LazyStackedTensorSpec` 方法) (`torchrl.data.MultiCategorical` 方法) (`torchrl.data.MultiDiscreteTensorSpec` 方法) (`torchrl.data.MultiOneHot` 方法) (`torchrl.data.MultiOneHotDiscreteTensorSpec` 方法) (`torchrl.data.NonTensor` 方法) (`torchrl.data.NonTensorSpec` 方法) (`torchrl.data.OneHot` 方法) (`torchrl.data.OneHotDiscreteTensorSpec` 方法) (`torchrl.data.Stacked` 方法) (`torchrl.data.StackedComposite` 方法) (`torchrl.data.TensorSpec` 方法) (`torchrl.data.Unbounded` 方法) (`torchrl.data.UnboundedContinuous` 方法) (`torchrl.data.UnboundedContinuousTensorSpec` 方法) (`torchrl.data.UnboundedDiscrete` 方法) (`torchrl.data.UnboundedDiscreteTensorSpec` 方法) Nested2TED (在 torchrl.data 中的类) NestedStorageCheckpointer (在 torchrl.data.replay_buffers 中的类) next_state_value (在 torchrl.objectives 中的类) node_observation (torchrl.data.Tree 属性) node_observations (torchrl.data.Tree 属性) NoisyLazyLinear (在 torchrl.modules 中的类) NoisyLinear (在 torchrl.modules 中的类) NonTensor (在 torchrl.data 中的类) NonTensorSpec (在 torchrl.data 中的类) NoopResetEnv (在 torchrl.envs.transforms 中的类) num_children (torchrl.data.Tree 属性) num_vertices() (torchrl.data.Tree 方法) O ObsDecoder (在 torchrl.modules 中的类) ObsEncoder (在 torchrl.modules 中的类) observation_keys (torchrl.data.MCTSForest 属性) (`torchrl.envs.ChessEnv` 属性) (`torchrl.envs.EnvBase` 属性) (`torchrl.envs.GymLikeEnv` 属性) (`torchrl.envs.LLMHashingEnv` 属性) (`torchrl.envs.ParallelEnv` 属性) (`torchrl.envs.PendulumEnv` 属性) (`torchrl.envs.SerialEnv` 属性) (`torchrl.envs.TicTacToeEnv` 属性) observation_spec (torchrl.envs.ChessEnv 属性) (`torchrl.envs.EnvBase` 属性) (`torchrl.envs.GymLikeEnv` 属性) (`torchrl.envs.LLMHashingEnv` 属性) (`torchrl.envs.ParallelEnv` 属性) (`torchrl.envs.PendulumEnv` 属性) (`torchrl.envs.SerialEnv` 属性) (`torchrl.envs.TicTacToeEnv` 属性) observation_spec_unbatched (torchrl.envs.ChessEnv 属性) (`torchrl.envs.EnvBase` 属性) (`torchrl.envs.GymLikeEnv` 属性) (`torchrl.envs.LLMHashingEnv` 属性) (`torchrl.envs.ParallelEnv` 属性) (`torchrl.envs.PendulumEnv` 属性) (`torchrl.envs.SerialEnv` 属性) (`torchrl.envs.TicTacToeEnv` 属性) ObservationNorm (在 torchrl.envs.transforms 中的类) ObservationTransform (在 torchrl.envs.transforms 中的类) one() (torchrl.data.Binary 方法) (`torchrl.data.BinaryDiscreteTensorSpec` 方法) (`torchrl.data.Bounded` 方法) (`torchrl.data.BoundedTensorSpec` 方法) (`torchrl.data.Categorical` 方法) (`torchrl.data.Composite` 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.DiscreteTensorSpec` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.LazyStackedTensorSpec` 方法) (`torchrl.data.MultiCategorical` 方法) (`torchrl.data.MultiDiscreteTensorSpec` 方法) (`torchrl.data.MultiOneHot` 方法) (`torchrl.data.MultiOneHotDiscreteTensorSpec` 方法) (`torchrl.data.NonTensor` 方法) (`torchrl.data.NonTensorSpec` 方法) (`torchrl.data.OneHot` 方法) (`torchrl.data.OneHotDiscreteTensorSpec` 方法) (`torchrl.data.Stacked` 方法) (`torchrl.data.StackedComposite` 方法) (`torchrl.data.TensorSpec` 方法) (`torchrl.data.Unbounded` 方法) (`torchrl.data.UnboundedContinuous` 方法) (`torchrl.data.UnboundedContinuousTensorSpec` 方法) (`torchrl.data.UnboundedDiscrete` 方法) (`torchrl.data.UnboundedDiscreteTensorSpec` 方法) OneHot (在 torchrl.data 中的类) OneHotCategorical (在 torchrl.modules 中的类) OneHotDiscreteTensorSpec (在 torchrl.data 中的类) OneHotOrdinal (在 torchrl.modules 中的类) ones() (torchrl.data.Binary 方法) (`torchrl.data.BinaryDiscreteTensorSpec` 方法) (`torchrl.data.Bounded` 方法) (`torchrl.data.BoundedTensorSpec` 方法) (`torchrl.data.Categorical` 方法) (`torchrl.data.Composite` 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.DiscreteTensorSpec` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.LazyStackedTensorSpec` 方法) (`torchrl.data.MultiCategorical` 方法) (`torchrl.data.MultiDiscreteTensorSpec` 方法) (`torchrl.data.MultiOneHot` 方法) (`torchrl.data.MultiOneHotDiscreteTensorSpec` 方法) (`torchrl.data.NonTensor` 方法) (`torchrl.data.NonTensorSpec` 方法) (`torchrl.data.OneHot` 方法) (`torchrl.data.OneHotDiscreteTensorSpec` 方法) (`torchrl.data.Stacked` 方法) (`torchrl.data.StackedComposite` 方法) (`torchrl.data.TensorSpec` 方法) (`torchrl.data.Unbounded` 方法) (`torchrl.data.UnboundedContinuous` 方法) (`torchrl.data.UnboundedContinuousTensorSpec` 方法) (`torchrl.data.UnboundedDiscrete` 方法) (`torchrl.data.UnboundedDiscreteTensorSpec` 方法) OnlineDTActor (在 torchrl.modules 中的类) OnlineDTLoss (在 torchrl.objectives 中的类) OpenMLEnv() (在模块 torchrl.envs 中) OpenMLExperienceReplay (在 torchrl.data.datasets 中的类) OpenSpielEnv() (在模块 torchrl.envs 中) OpenSpielWrapper() (在模块 torchrl.envs 中) OpenXExperienceReplay (在 torchrl.data.datasets 中的类) OptimizerHook (在 torchrl.trainers 中的类) Ordinal (在 torchrl.modules 中的类) OrnsteinUhlenbeckProcessModule (在 torchrl.modules 中的类) output_spec (torchrl.envs.ChessEnv 属性) (`torchrl.envs.EnvBase` 属性) (`torchrl.envs.GymLikeEnv` 属性) (`torchrl.envs.LLMHashingEnv` 属性) (`torchrl.envs.ParallelEnv` 属性) (`torchrl.envs.PendulumEnv` 属性) (`torchrl.envs.SerialEnv` 属性) (`torchrl.envs.TicTacToeEnv` 属性) (`torchrl.envs.transforms.TransformedEnv` 属性) output_spec_unbatched (torchrl.envs.ChessEnv 属性) (`torchrl.envs.EnvBase` 属性) (`torchrl.envs.GymLikeEnv` 属性) (`torchrl.envs.LLMHashingEnv` 属性) (`torchrl.envs.ParallelEnv` 属性) (`torchrl.envs.PendulumEnv` 属性) (`torchrl.envs.SerialEnv` 属性) (`torchrl.envs.TicTacToeEnv` 属性) P PairwiseDataset (在 torchrl.data 中的类) parallel_env_constructor() (在模块 torchrl.trainers.helpers 中) ParallelEnv (在 torchrl.envs 中的类) parameters() (torchrl.data.BinaryToDecimal 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) (`torchrl.objectives.LossModule` 方法) parent (torchrl.data.Tree 属性) (torchrl.envs.transforms.rb_transforms.MultiStepTransform 属性) (`torchrl.envs.transforms.Transform` 属性) PendulumEnv (在 torchrl.envs 中的类) PermuteTransform (在 torchrl.envs.transforms 中的类) PettingZooEnv() (在模块 torchrl.envs 中) PettingZooWrapper() (在模块 torchrl.envs 中) PinMemoryTransform (在 torchrl.envs.transforms 中的类) PixelRenderTransform() (在模块 torchrl.record 中) planning() (torchrl.modules.CEMPlanner 方法) (`torchrl.modules.MPCPlannerBase` 方法) (torchrl.modules.MPPIPlanner 方法) plot() (torchrl.data.Tree 方法) pop() (torchrl.data.Composite 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.StackedComposite` 方法) PPOLoss (在 torchrl.objectives 中的类) preprocess() (torchrl.data.datasets.AtariDQNExperienceReplay 方法) (`torchrl.data.datasets.BaseDatasetExperienceReplay` 方法) (`torchrl.data.datasets.D4RLExperienceReplay` 方法) (`torchrl.data.datasets.GenDGRLExperienceReplay` 方法) (`torchrl.data.datasets.MinariExperienceReplay` 方法) (`torchrl.data.datasets.OpenMLExperienceReplay` 方法) (`torchrl.data.datasets.OpenXExperienceReplay` 方法) (`torchrl.data.datasets.RobosetExperienceReplay` 方法) (`torchrl.data.datasets.VD4RLExperienceReplay` 方法) prev_action (torchrl.data.Tree 属性) PrioritizedReplayBuffer (在 torchrl.data 中的类) PrioritizedSampler (在 torchrl.data.replay_buffers 中的类) PrioritizedSliceSampler (在 torchrl.data.replay_buffers 中的类) ProbabilisticActor (在 torchrl.modules.tensordict_module 中的类) project() (torchrl.data.Binary 方法) (`torchrl.data.BinaryDiscreteTensorSpec` 方法) (`torchrl.data.Bounded` 方法) (`torchrl.data.BoundedTensorSpec` 方法) (`torchrl.data.Categorical` 方法) (`torchrl.data.Composite` 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.DiscreteTensorSpec` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.LazyStackedTensorSpec` 方法) (`torchrl.data.MultiCategorical` 方法) (`torchrl.data.MultiDiscreteTensorSpec` 方法) (`torchrl.data.MultiOneHot` 方法) (`torchrl.data.MultiOneHotDiscreteTensorSpec` 方法) (`torchrl.data.NonTensor` 方法) (`torchrl.data.NonTensorSpec` 方法) (`torchrl.data.OneHot` 方法) (`torchrl.data.OneHotDiscreteTensorSpec` 方法) (`torchrl.data.Stacked` 方法) (`torchrl.data.StackedComposite` 方法) (`torchrl.data.TensorSpec` 方法) (`torchrl.data.Unbounded` 方法) (`torchrl.data.UnboundedContinuous` 方法) (`torchrl.data.UnboundedContinuousTensorSpec` 方法) (`torchrl.data.UnboundedDiscrete` 方法) (`torchrl.data.UnboundedDiscreteTensorSpec` 方法) PromptData (在 torchrl.data 中的类) PromptTensorDictTokenizer (在 torchrl.data 中的类) Q QMixer (在 torchrl.modules 中的类) QMixerLoss (在 torchrl.objectives.multiagent 中的类) QueryModule (在 torchrl.data 中的类) qvalue_loss() (torchrl.objectives.CrossQLoss 方法) (`torchrl.objectives.TD3BCLoss` 方法) QValueActor (在 torchrl.modules.tensordict_module 中的类) QValueHook (在 torchrl.modules 中的类) QValueModule (在 torchrl.modules.tensordict_module 中的类) R R3MTransform (在 torchrl.envs.transforms 中的类) rand() (torchrl.data.Binary 方法) (`torchrl.data.BinaryDiscreteTensorSpec` 方法) (`torchrl.data.Bounded` 方法) (`torchrl.data.BoundedTensorSpec` 方法) (`torchrl.data.Categorical` 方法) (`torchrl.data.Composite` 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.DiscreteTensorSpec` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.LazyStackedTensorSpec` 方法) (`torchrl.data.MultiCategorical` 方法) (`torchrl.data.MultiDiscreteTensorSpec` 方法) (`torchrl.data.MultiOneHot` 方法) (`torchrl.data.MultiOneHotDiscreteTensorSpec` 方法) (`torchrl.data.NonTensor` 方法) (`torchrl.data.NonTensorSpec` 方法) (`torchrl.data.OneHot` 方法) (`torchrl.data.OneHotDiscreteTensorSpec` 方法) (`torchrl.data.Stacked` 方法) (`torchrl.data.StackedComposite` 方法) (`torchrl.data.TensorSpec` 方法) (`torchrl.data.Unbounded` 方法) (`torchrl.data.UnboundedContinuous` 方法) (`torchrl.data.UnboundedContinuousTensorSpec` 方法) (`torchrl.data.UnboundedDiscrete` 方法) (`torchrl.data.UnboundedDiscreteTensorSpec` 方法) rand_action() (torchrl.envs.ChessEnv 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.TransformedEnv` 方法) rand_step() (在模块 torchrl.envs 中) (`torchrl.envs.ChessEnv` 方法) (torchrl.envs.EnvBase 方法), [1] (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) random() (torchrl.modules.tensordict_module.SafeModule 方法) (torchrl.modules.tensordict_module.SafeProbabilisticModule 方法) random_sample() (torchrl.modules.tensordict_module.SafeModule 方法) (torchrl.modules.tensordict_module.SafeProbabilisticModule 方法) RandomCropTensorDict (在 torchrl.envs.transforms 中的类) RandomPolicy() (在模块 torchrl.envs.utils 中) RandomProjectionHash (在 torchrl.data 中的类) RandomSampler (在 torchrl.data.replay_buffers 中的类) RayCollector (在 torchrl.collectors.distributed 中的类) read_action() (torchrl.envs.GymLikeEnv 方法) read_done() (torchrl.envs.GymLikeEnv 方法) read_obs() (torchrl.envs.GymLikeEnv 方法) read_reward() (torchrl.envs.GymLikeEnv 方法) recurrent_mode (在 torchrl.modules 中的类) REDQLoss (在 torchrl.objectives 中的类) register() (torchrl.trainers.BatchSubSampler 方法) (torchrl.trainers.ClearCudaCache 方法) (torchrl.trainers.CountFramesLog 方法) (torchrl.trainers.LogScalar 方法) (torchrl.trainers.LogValidationReward 方法) (torchrl.trainers.OptimizerHook 方法) (torchrl.trainers.ReplayBufferTrainer 方法) (torchrl.trainers.RewardNormalizer 方法) (torchrl.trainers.SelectKeys 方法) (torchrl.trainers.TrainerHookBase 方法) (torchrl.trainers.UpdateWeights 方法) register_backward_hook() (torchrl.data.BinaryToDecimal 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) register_buffer() (torchrl.data.BinaryToDecimal 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) register_forward_hook() (torchrl.data.BinaryToDecimal 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) register_forward_pre_hook() (torchrl.data.BinaryToDecimal 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) register_full_backward_hook() (torchrl.data.BinaryToDecimal 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) register_full_backward_pre_hook() (torchrl.data.BinaryToDecimal 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) register_gym() (torchrl.envs.ChessEnv 类方法) (torchrl.envs.EnvBase 类方法) (torchrl.envs.GymLikeEnv 类方法) (torchrl.envs.LLMHashingEnv 类方法) (torchrl.envs.ParallelEnv 类方法) (torchrl.envs.PendulumEnv 类方法) (torchrl.envs.SerialEnv 类方法) (torchrl.envs.TicTacToeEnv 类方法) register_gym_spec_conversion() (在模块 torchrl.envs 中) register_keys() (torchrl.envs.transforms.EndOfLifeTransform 方法) register_load_hook() (torchrl.data.datasets.AtariDQNExperienceReplay 方法) (`torchrl.data.datasets.BaseDatasetExperienceReplay` 方法) (`torchrl.data.datasets.D4RLExperienceReplay` 方法) (`torchrl.data.datasets.GenDGRLExperienceReplay` 方法) (`torchrl.data.datasets.MinariExperienceReplay` 方法) (`torchrl.data.datasets.OpenMLExperienceReplay` 方法) (`torchrl.data.datasets.OpenXExperienceReplay` 方法) (`torchrl.data.datasets.RobosetExperienceReplay` 方法) (`torchrl.data.datasets.VD4RLExperienceReplay` 方法) (`torchrl.data.PrioritizedReplayBuffer` 方法) (`torchrl.data.replay_buffers.ReplayBufferEnsemble` 方法) (`torchrl.data.ReplayBuffer` 方法) (`torchrl.data.TensorDictPrioritizedReplayBuffer` 方法) (`torchrl.data.TensorDictReplayBuffer` 方法) register_load_state_dict_post_hook() (torchrl.data.BinaryToDecimal 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) register_load_state_dict_pre_hook() (torchrl.data.BinaryToDecimal 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) register_module() (torchrl.data.BinaryToDecimal 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) register_parameter() (torchrl.data.BinaryToDecimal 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) register_save_hook() (torchrl.data.datasets.AtariDQNExperienceReplay 方法) (`torchrl.data.datasets.BaseDatasetExperienceReplay` 方法) (`torchrl.data.datasets.D4RLExperienceReplay` 方法) (`torchrl.data.datasets.GenDGRLExperienceReplay` 方法) (`torchrl.data.datasets.MinariExperienceReplay` 方法) (`torchrl.data.datasets.OpenMLExperienceReplay` 方法) (`torchrl.data.datasets.OpenXExperienceReplay` 方法) (`torchrl.data.datasets.RobosetExperienceReplay` 方法) (`torchrl.data.datasets.VD4RLExperienceReplay` 方法) (`torchrl.data.PrioritizedReplayBuffer` 方法) (`torchrl.data.replay_buffers.ReplayBufferEnsemble` 方法) (`torchrl.data.ReplayBuffer` 方法) (`torchrl.data.TensorDictPrioritizedReplayBuffer` 方法) (`torchrl.data.TensorDictReplayBuffer` 方法) register_state_dict_post_hook() (torchrl.data.BinaryToDecimal 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) register_state_dict_pre_hook() (torchrl.data.BinaryToDecimal 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) ReinforceLoss (在 torchrl.objectives 中的类) remote_collectors() (torchrl.collectors.distributed.RayCollector 方法) RemoveEmptySpecs (在 torchrl.envs.transforms 中的类) RenameTransform (在 torchrl.envs.transforms 中的类) ReplayBuffer (在 torchrl.data 中的类) ReplayBufferEnsemble (在 torchrl.data.replay_buffers 中的类) ReplayBufferTrainer (在 torchrl.trainers 中的类) reproducible_hash() (torchrl.envs.transforms.Hash 类方法) requires_grad_() (torchrl.data.BinaryToDecimal 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) reset() (在模块 torchrl.envs 中) (torchrl._utils.implement_for 类方法) (torchrl.collectors.aSyncDataCollector 方法) (`torchrl.collectors.MultiaSyncDataCollector` 方法) (`torchrl.collectors.MultiSyncDataCollector` 方法) (`torchrl.collectors.SyncDataCollector` 方法) (`torchrl.envs.ChessEnv` 方法) (torchrl.envs.EnvBase 方法), [1] (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) reset_keys (torchrl.envs.ChessEnv 属性) (`torchrl.envs.EnvBase` 属性) (`torchrl.envs.GymLikeEnv` 属性) (`torchrl.envs.LLMHashingEnv` 属性) (`torchrl.envs.ParallelEnv` 属性) (`torchrl.envs.PendulumEnv` 属性) (`torchrl.envs.SerialEnv` 属性) (`torchrl.envs.TicTacToeEnv` 属性) reset_noise (在 torchrl.modules 中的类) reset_out_keys() (torchrl.data.QueryModule 方法) (`torchrl.data.TensorDictMap` 方法) reset_parameters() (torchrl.modules.MultiAgentNetBase 方法) reset_parameters_recursive() (torchrl.data.QueryModule 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.objectives.LossModule` 方法) reshape() (torchrl.data.Binary 方法) (`torchrl.data.BinaryDiscreteTensorSpec` 方法) (`torchrl.data.Bounded` 方法) (`torchrl.data.BoundedTensorSpec` 方法) (`torchrl.data.Categorical` 方法) (`torchrl.data.Composite` 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.DiscreteTensorSpec` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.LazyStackedTensorSpec` 方法) (`torchrl.data.MultiCategorical` 方法) (`torchrl.data.MultiDiscreteTensorSpec` 方法) (`torchrl.data.MultiOneHot` 方法) (`torchrl.data.MultiOneHotDiscreteTensorSpec` 方法) (`torchrl.data.NonTensor` 方法) (`torchrl.data.NonTensorSpec` 方法) (`torchrl.data.OneHot` 方法) (`torchrl.data.OneHotDiscreteTensorSpec` 方法) (`torchrl.data.Stacked` 方法) (`torchrl.data.StackedComposite` 方法) (`torchrl.data.TensorSpec` 方法) (`torchrl.data.Unbounded` 方法) (`torchrl.data.UnboundedContinuous` 方法) (`torchrl.data.UnboundedContinuousTensorSpec` 方法) (`torchrl.data.UnboundedDiscrete` 方法) (`torchrl.data.UnboundedDiscreteTensorSpec` 方法) Resize (在 torchrl.envs.transforms 中的类) reward2go (在 torchrl.objectives.value.functional 中的类) Reward2GoTransform (在 torchrl.envs.transforms 中的类) reward_key (torchrl.envs.ChessEnv 属性) (`torchrl.envs.EnvBase` 属性) (`torchrl.envs.GymLikeEnv` 属性) (`torchrl.envs.LLMHashingEnv` 属性) (`torchrl.envs.ParallelEnv` 属性) (`torchrl.envs.PendulumEnv` 属性) (`torchrl.envs.SerialEnv` 属性) (`torchrl.envs.TicTacToeEnv` 属性) reward_keys (torchrl.data.MCTSForest 属性) (`torchrl.envs.ChessEnv` 属性) (`torchrl.envs.EnvBase` 属性) (`torchrl.envs.GymLikeEnv` 属性) (`torchrl.envs.LLMHashingEnv` 属性) (`torchrl.envs.ParallelEnv` 属性) (`torchrl.envs.PendulumEnv` 属性) (`torchrl.envs.SerialEnv` 属性) (`torchrl.envs.TicTacToeEnv` 属性) reward_spec (torchrl.envs.ChessEnv 属性) (`torchrl.envs.EnvBase` 属性) (`torchrl.envs.GymLikeEnv` 属性) (`torchrl.envs.LLMHashingEnv` 属性) (`torchrl.envs.ParallelEnv` 属性) (`torchrl.envs.PendulumEnv` 属性) (`torchrl.envs.SerialEnv` 属性) (`torchrl.envs.TicTacToeEnv` 属性) reward_spec_unbatched (torchrl.envs.ChessEnv 属性) (`torchrl.envs.EnvBase` 属性) (`torchrl.envs.GymLikeEnv` 属性) (`torchrl.envs.LLMHashingEnv` 属性) (`torchrl.envs.ParallelEnv` 属性) (`torchrl.envs.PendulumEnv` 属性) (`torchrl.envs.SerialEnv` 属性) (`torchrl.envs.TicTacToeEnv` 属性) RewardClipping (在 torchrl.envs.transforms 中的类) RewardData (在 torchrl.data 中的类) RewardNormalizer (在 torchrl.trainers 中的类) RewardScaling (在 torchrl.envs.transforms 中的类) RewardSum (在 torchrl.envs.transforms 中的类) RoboHiveEnv() (在模块 torchrl.envs 中) RobosetExperienceReplay (在 torchrl.data.datasets 中的类) rollout() (在模块 torchrl.envs 中) (`torchrl.collectors.SyncDataCollector` 方法) (`torchrl.envs.ChessEnv` 方法) (torchrl.envs.EnvBase 方法), [1] (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) rollout_from_path() (torchrl.data.Tree 方法) RolloutFromModel (在 torchrl.data 中的类) RoundRobinWriter (在 torchrl.data.replay_buffers 中的类) RPCDataCollector (在 torchrl.collectors.distributed 中的类) rsample() (torchrl.modules.Delta 方法) (`torchrl.modules.MaskedOneHotCategorical` 方法) (`torchrl.modules.OneHotCategorical` 方法) RSSMPosterior (在 torchrl.modules 中的类) RSSMPrior (在 torchrl.modules 中的类) S SACLoss (在 torchrl.objectives 中的类) SafeModule (在 torchrl.modules.tensordict_module 中的类) SafeProbabilisticModule (在 torchrl.modules.tensordict_module 中的类) SafeProbabilisticTensorDictSequential (在 torchrl.modules.tensordict_module 中的类) SafeSequential (在 torchrl.modules.tensordict_module 中的类) sample() (torchrl.data.Binary 方法) (`torchrl.data.BinaryDiscreteTensorSpec` 方法) (`torchrl.data.Bounded` 方法) (`torchrl.data.BoundedTensorSpec` 方法) (`torchrl.data.Categorical` 方法) (`torchrl.data.Composite` 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.datasets.AtariDQNExperienceReplay` 方法) (`torchrl.data.datasets.BaseDatasetExperienceReplay` 方法) (`torchrl.data.datasets.D4RLExperienceReplay` 方法) (`torchrl.data.datasets.GenDGRLExperienceReplay` 方法) (`torchrl.data.datasets.MinariExperienceReplay` 方法) (`torchrl.data.datasets.OpenMLExperienceReplay` 方法) (`torchrl.data.datasets.OpenXExperienceReplay` 方法) (`torchrl.data.datasets.RobosetExperienceReplay` 方法) (`torchrl.data.datasets.VD4RLExperienceReplay` 方法) (`torchrl.data.DiscreteTensorSpec` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.LazyStackedTensorSpec` 方法) (`torchrl.data.MultiCategorical` 方法) (`torchrl.data.MultiDiscreteTensorSpec` 方法) (`torchrl.data.MultiOneHot` 方法) (`torchrl.data.MultiOneHotDiscreteTensorSpec` 方法) (`torchrl.data.NonTensor` 方法) (`torchrl.data.NonTensorSpec` 方法) (`torchrl.data.OneHot` 方法) (`torchrl.data.OneHotDiscreteTensorSpec` 方法) (`torchrl.data.PrioritizedReplayBuffer` 方法) (`torchrl.data.replay_buffers.ReplayBufferEnsemble` 方法) (`torchrl.data.ReplayBuffer` 方法) (`torchrl.data.Stacked` 方法) (`torchrl.data.StackedComposite` 方法) (`torchrl.data.TensorDictPrioritizedReplayBuffer` 方法) (`torchrl.data.TensorDictReplayBuffer` 方法) (`torchrl.data.TensorSpec` 方法) (`torchrl.data.Unbounded` 方法) (`torchrl.data.UnboundedContinuous` 方法) (`torchrl.data.UnboundedContinuousTensorSpec` 方法) (`torchrl.data.UnboundedDiscrete` 方法) (`torchrl.data.UnboundedDiscreteTensorSpec` 方法) (`torchrl.modules.Delta` 方法) (`torchrl.modules.MaskedCategorical` 方法) (`torchrl.modules.MaskedOneHotCategorical` 方法) (`torchrl.modules.OneHotCategorical` 方法) Sampler (在 torchrl.data.replay_buffers 中的类) sampler (torchrl.data.datasets.AtariDQNExperienceReplay 属性) (`torchrl.data.datasets.BaseDatasetExperienceReplay` 属性) (`torchrl.data.datasets.D4RLExperienceReplay` 属性) (`torchrl.data.datasets.GenDGRLExperienceReplay` 属性) (`torchrl.data.datasets.MinariExperienceReplay` 属性) (`torchrl.data.datasets.OpenMLExperienceReplay` 属性) (`torchrl.data.datasets.OpenXExperienceReplay` 属性) (`torchrl.data.datasets.RobosetExperienceReplay` 属性) (`torchrl.data.datasets.VD4RLExperienceReplay` 属性) (torchrl.data.PrioritizedReplayBuffer 属性) (torchrl.data.replay_buffers.ReplayBufferEnsemble 属性) (torchrl.data.ReplayBuffer 属性) (torchrl.data.TensorDictPrioritizedReplayBuffer 属性) (torchrl.data.TensorDictReplayBuffer 属性) SamplerEnsemble (在 torchrl.data.replay_buffers 中的类) SamplerWithoutReplacement (在 torchrl.data.replay_buffers 中的类) save() (torchrl.data.datasets.AtariDQNExperienceReplay 方法) (`torchrl.data.datasets.BaseDatasetExperienceReplay` 方法) (`torchrl.data.datasets.D4RLExperienceReplay` 方法) (`torchrl.data.datasets.GenDGRLExperienceReplay` 方法) (`torchrl.data.datasets.MinariExperienceReplay` 方法) (`torchrl.data.datasets.OpenMLExperienceReplay` 方法) (`torchrl.data.datasets.OpenXExperienceReplay` 方法) (`torchrl.data.datasets.RobosetExperienceReplay` 方法) (`torchrl.data.datasets.VD4RLExperienceReplay` 方法) (`torchrl.data.PairwiseDataset` 方法) (`torchrl.data.PrioritizedReplayBuffer` 方法) (`torchrl.data.PromptData` 方法) (`torchrl.data.replay_buffers.LazyMemmapStorage` 方法) (`torchrl.data.replay_buffers.LazyStackStorage` 方法) (`torchrl.data.replay_buffers.LazyTensorStorage` 方法) (`torchrl.data.replay_buffers.ListStorage` 方法) (`torchrl.data.replay_buffers.ReplayBufferEnsemble` 方法) (`torchrl.data.replay_buffers.Storage` 方法) (`torchrl.data.replay_buffers.StorageEnsemble` 方法) (`torchrl.data.replay_buffers.TensorStorage` 方法) (`torchrl.data.ReplayBuffer` 方法) (`torchrl.data.RewardData` 方法) (`torchrl.data.TensorDictPrioritizedReplayBuffer` 方法) (`torchrl.data.TensorDictReplayBuffer` 方法) (`torchrl.data.Tree` 方法) scale (torchrl.envs.transforms.VecNorm 属性) select_out_keys() (torchrl.data.QueryModule 方法) (`torchrl.data.TensorDictMap` 方法) selected_actions (torchrl.data.Tree 属性) SelectKeys (在 torchrl.trainers 中的类) SelectTransform (在 torchrl.envs.transforms 中的类) separates() (torchrl.data.Composite 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.StackedComposite` 方法) SerialEnv (在 torchrl.envs 中的类) set() (torchrl.data.Composite 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.PairwiseDataset` 方法) (`torchrl.data.PromptData` 方法) (`torchrl.data.RewardData` 方法) (`torchrl.data.StackedComposite` 方法) (`torchrl.data.Tree` 方法) set_exploration_type() (在模块 torchrl.envs.utils 中) set_extra_state() (torchrl.data.BinaryToDecimal 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) (`torchrl.envs.transforms.VecNorm` 方法) set_gym_backend() (在模块 torchrl.envs 中) set_info_dict_reader() (torchrl.envs.GymLikeEnv 方法) set_keys() (torchrl.objectives.CrossQLoss 方法) (`torchrl.objectives.LossModule` 方法) (`torchrl.objectives.value.ValueEstimatorBase` 方法) set_missing_tolerance() (torchrl.envs.transforms.TransformedEnv 方法) set_provisional_n() (torchrl.data.Binary 方法) (`torchrl.data.BinaryDiscreteTensorSpec` 方法) (`torchrl.data.Categorical` 方法) (`torchrl.data.DiscreteTensorSpec` 方法) (`torchrl.data.MultiCategorical` 方法) (`torchrl.data.MultiDiscreteTensorSpec` 方法) set_recurrent_mode (在 torchrl.modules 中的类) set_recurrent_mode() (torchrl.modules.GRUModule 方法), [1] (torchrl.modules.LSTMModule 方法), [1] set_sampler() (torchrl.data.datasets.AtariDQNExperienceReplay 方法) (`torchrl.data.datasets.BaseDatasetExperienceReplay` 方法) (`torchrl.data.datasets.D4RLExperienceReplay` 方法) (`torchrl.data.datasets.GenDGRLExperienceReplay` 方法) (`torchrl.data.datasets.MinariExperienceReplay` 方法) (`torchrl.data.datasets.OpenMLExperienceReplay` 方法) (`torchrl.data.datasets.OpenXExperienceReplay` 方法) (`torchrl.data.datasets.RobosetExperienceReplay` 方法) (`torchrl.data.datasets.VD4RLExperienceReplay` 方法) (`torchrl.data.PrioritizedReplayBuffer` 方法) (`torchrl.data.replay_buffers.ReplayBufferEnsemble` 方法) (`torchrl.data.ReplayBuffer` 方法) (`torchrl.data.TensorDictPrioritizedReplayBuffer` 方法) (`torchrl.data.TensorDictReplayBuffer` 方法) set_seed() (在模块 torchrl.envs 中) (torchrl.collectors.aSyncDataCollector 方法) (`torchrl.collectors.distributed.RayCollector` 方法) (`torchrl.collectors.MultiaSyncDataCollector` 方法) (`torchrl.collectors.MultiSyncDataCollector` 方法) (`torchrl.collectors.SyncDataCollector` 方法) (`torchrl.envs.ChessEnv` 方法) (torchrl.envs.EnvBase 方法), [1] (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.TransformedEnv` 方法) set_spec_lock_() (torchrl.envs.ChessEnv 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) set_storage() (torchrl.data.datasets.AtariDQNExperienceReplay 方法) (`torchrl.data.datasets.BaseDatasetExperienceReplay` 方法) (`torchrl.data.datasets.D4RLExperienceReplay` 方法) (`torchrl.data.datasets.GenDGRLExperienceReplay` 方法) (`torchrl.data.datasets.MinariExperienceReplay` 方法) (`torchrl.data.datasets.OpenMLExperienceReplay` 方法) (`torchrl.data.datasets.OpenXExperienceReplay` 方法) (`torchrl.data.datasets.RobosetExperienceReplay` 方法) (`torchrl.data.datasets.VD4RLExperienceReplay` 方法) (`torchrl.data.PrioritizedReplayBuffer` 方法) (`torchrl.data.replay_buffers.ReplayBufferEnsemble` 方法) (`torchrl.data.ReplayBuffer` 方法) (`torchrl.data.TensorDictPrioritizedReplayBuffer` 方法) (`torchrl.data.TensorDictReplayBuffer` 方法) set_submodule() (torchrl.data.BinaryToDecimal 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) set_tensor_keys() (torchrl.modules.tensordict_module.DecisionTransformerInferenceWrapper 方法) set_writer() (torchrl.data.datasets.AtariDQNExperienceReplay 方法) (`torchrl.data.datasets.BaseDatasetExperienceReplay` 方法) (`torchrl.data.datasets.D4RLExperienceReplay` 方法) (`torchrl.data.datasets.GenDGRLExperienceReplay` 方法) (`torchrl.data.datasets.MinariExperienceReplay` 方法) (`torchrl.data.datasets.OpenMLExperienceReplay` 方法) (`torchrl.data.datasets.OpenXExperienceReplay` 方法) (`torchrl.data.datasets.RobosetExperienceReplay` 方法) (`torchrl.data.datasets.VD4RLExperienceReplay` 方法) (`torchrl.data.PrioritizedReplayBuffer` 方法) (`torchrl.data.replay_buffers.ReplayBufferEnsemble` 方法) (`torchrl.data.ReplayBuffer` 方法) (`torchrl.data.TensorDictPrioritizedReplayBuffer` 方法) (`torchrl.data.TensorDictReplayBuffer` 方法) shape (torchrl.envs.ChessEnv 属性) (`torchrl.envs.EnvBase` 属性) (`torchrl.envs.GymLikeEnv` 属性) (`torchrl.envs.LLMHashingEnv` 属性) (`torchrl.envs.ParallelEnv` 属性) (`torchrl.envs.PendulumEnv` 属性) (`torchrl.envs.SerialEnv` 属性) (`torchrl.envs.TicTacToeEnv` 属性) share_memory() (torchrl.data.BinaryToDecimal 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) shutdown() (torchrl.collectors.aSyncDataCollector 方法) (`torchrl.collectors.distributed.RayCollector` 方法) (`torchrl.collectors.MultiaSyncDataCollector` 方法) (`torchrl.collectors.MultiSyncDataCollector` 方法) (`torchrl.collectors.SyncDataCollector` 方法) SignTransform (在 torchrl.envs.transforms 中的类) SipHash (在 torchrl.data 中的类) SliceSampler (在 torchrl.data.replay_buffers 中的类) SliceSamplerWithoutReplacement (在 torchrl.data.replay_buffers 中的类) SMACv2Env() (在模块 torchrl.envs 中) SMACv2Wrapper() (在模块 torchrl.envs 中) SoftUpdate (在 torchrl.objectives 中的类) specs (torchrl.envs.ChessEnv 属性) (`torchrl.envs.EnvBase` 属性) (`torchrl.envs.GymLikeEnv` 属性) (`torchrl.envs.LLMHashingEnv` 属性) (`torchrl.envs.ParallelEnv` 属性) (`torchrl.envs.PendulumEnv` 属性) (`torchrl.envs.SerialEnv` 属性) (`torchrl.envs.TicTacToeEnv` 属性) split_trajectories() (在模块 torchrl.collectors.utils 中) squeeze() (torchrl.data.Binary 方法) (`torchrl.data.BinaryDiscreteTensorSpec` 方法) (`torchrl.data.Bounded` 方法) (`torchrl.data.BoundedTensorSpec` 方法) (`torchrl.data.Categorical` 方法) (`torchrl.data.Composite` 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.DiscreteTensorSpec` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.LazyStackedTensorSpec` 方法) (`torchrl.data.MultiCategorical` 方法) (`torchrl.data.MultiDiscreteTensorSpec` 方法) (`torchrl.data.MultiOneHot` 方法) (`torchrl.data.MultiOneHotDiscreteTensorSpec` 方法) (`torchrl.data.NonTensor` 方法) (`torchrl.data.NonTensorSpec` 方法) (`torchrl.data.OneHot` 方法) (`torchrl.data.OneHotDiscreteTensorSpec` 方法) (`torchrl.data.Stacked` 方法) (`torchrl.data.StackedComposite` 方法) (`torchrl.data.TensorSpec` 方法) (`torchrl.data.Unbounded` 方法) (`torchrl.data.UnboundedContinuous` 方法) (`torchrl.data.UnboundedContinuousTensorSpec` 方法) (`torchrl.data.UnboundedDiscrete` 方法) (`torchrl.data.UnboundedDiscreteTensorSpec` 方法) Squeeze2dLayer (在 torchrl.modules 中的类) SqueezeLayer (在 torchrl.modules 中的类) SqueezeTransform (在 torchrl.envs.transforms 中的类) Stack (在 torchrl.envs.transforms 中的类) Stacked (在 torchrl.data 中的类) StackedComposite (在 torchrl.data 中的类) standard_normal (torchrl.envs.transforms.VecNorm 属性) state_dict() (torchrl.collectors.aSyncDataCollector 方法) (`torchrl.collectors.distributed.RayCollector` 方法) (`torchrl.collectors.MultiaSyncDataCollector` 方法) (`torchrl.collectors.MultiSyncDataCollector` 方法) (`torchrl.collectors.SyncDataCollector` 方法) (`torchrl.data.BinaryToDecimal` 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.PairwiseDataset` 方法) (`torchrl.data.PromptData` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.RewardData` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.data.Tree` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (torchrl.envs.transforms.Hash 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) (`torchrl.envs.transforms.TrajCounter` 方法) (`torchrl.envs.transforms.TransformedEnv` 方法) (`torchrl.objectives.CrossQLoss` 方法) (`torchrl.objectives.SACLoss` 方法) state_keys (torchrl.envs.ChessEnv 属性) (`torchrl.envs.EnvBase` 属性) (`torchrl.envs.GymLikeEnv` 属性) (`torchrl.envs.LLMHashingEnv` 属性) (`torchrl.envs.ParallelEnv` 属性) (`torchrl.envs.PendulumEnv` 属性) (`torchrl.envs.SerialEnv` 属性) (`torchrl.envs.TicTacToeEnv` 属性) state_spec (torchrl.envs.ChessEnv 属性) (`torchrl.envs.EnvBase` 属性) (`torchrl.envs.GymLikeEnv` 属性) (`torchrl.envs.LLMHashingEnv` 属性) (`torchrl.envs.ParallelEnv` 属性) (`torchrl.envs.PendulumEnv` 属性) (`torchrl.envs.SerialEnv` 属性) (`torchrl.envs.TicTacToeEnv` 属性) state_spec_unbatched (torchrl.envs.ChessEnv 属性) (`torchrl.envs.EnvBase` 属性) (`torchrl.envs.GymLikeEnv` 属性) (`torchrl.envs.LLMHashingEnv` 属性) (`torchrl.envs.ParallelEnv` 属性) (`torchrl.envs.PendulumEnv` 属性) (`torchrl.envs.SerialEnv` 属性) (`torchrl.envs.TicTacToeEnv` 属性) step() (在模块 torchrl.envs 中) (`torchrl.envs.ChessEnv` 方法) (torchrl.envs.EnvBase 方法), [1] (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.modules.AdditiveGaussianModule` 方法) (`torchrl.modules.EGreedyModule` 方法) (`torchrl.modules.OrnsteinUhlenbeckProcessModule` 方法) step_and_maybe_reset() (torchrl.envs.ChessEnv 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) step_mdp() (在模块 torchrl.envs.utils 中) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) StepCounter (在 torchrl.envs.transforms 中的类) stop_remote_collectors() (torchrl.collectors.distributed.RayCollector 方法) Storage (在 torchrl.data.replay_buffers 中的类) storage (torchrl.data.datasets.AtariDQNExperienceReplay 属性) (`torchrl.data.datasets.BaseDatasetExperienceReplay` 属性) (`torchrl.data.datasets.D4RLExperienceReplay` 属性) (`torchrl.data.datasets.GenDGRLExperienceReplay` 属性) (`torchrl.data.datasets.MinariExperienceReplay` 属性) (`torchrl.data.datasets.OpenMLExperienceReplay` 属性) (`torchrl.data.datasets.OpenXExperienceReplay` 属性) (`torchrl.data.datasets.RobosetExperienceReplay` 属性) (`torchrl.data.datasets.VD4RLExperienceReplay` 属性) (torchrl.data.PrioritizedReplayBuffer 属性) (torchrl.data.replay_buffers.ReplayBufferEnsemble 属性) (torchrl.data.ReplayBuffer 属性) (torchrl.data.TensorDictPrioritizedReplayBuffer 属性) (torchrl.data.TensorDictReplayBuffer 属性) StorageCheckpointerBase (在 torchrl.data.replay_buffers 中的类) StorageEnsemble (在 torchrl.data.replay_buffers 中的类) StorageEnsembleCheckpointer (在 torchrl.data.replay_buffers 中的类) submitit_delayed_launcher (在 torchrl.collectors.distributed 中的类) support (torchrl.modules.TanhNormal 属性) sync_async_collector() (在模块 torchrl.trainers.helpers 中) sync_sync_collector() (在模块 torchrl.trainers.helpers 中) SyncDataCollector (在 torchrl.collectors 中的类) T TanhDelta (在 torchrl.modules 中的类) TanhModule (在 torchrl.modules.tensordict_module 中的类) TanhNormal (在 torchrl.modules 中的类) target_entropy_buffer (torchrl.objectives.CrossQLoss 属性) TargetReturn (在 torchrl.envs.transforms 中的类) td0_advantage_estimate (在 torchrl.objectives.value.functional 中的类) td0_return_estimate (在 torchrl.objectives.value.functional 中的类) TD0Estimator (在 torchrl.objectives.value 中的类) td1_advantage_estimate (在 torchrl.objectives.value.functional 中的类) td1_return_estimate (在 torchrl.objectives.value.functional 中的类) TD1Estimator (在 torchrl.objectives.value 中的类) TD3BCLoss (在 torchrl.objectives 中的类) TD3Loss (在 torchrl.objectives 中的类) td_lambda_advantage_estimate (在 torchrl.objectives.value.functional 中的类) td_lambda_return_estimate (在 torchrl.objectives.value.functional 中的类) TDLambdaEstimator (在 torchrl.objectives.value 中的类) TED2Flat (在 torchrl.data 中的类) TED2Nested (在 torchrl.data 中的类) TensorboardLogger() (在模块 torchrl.record.loggers.tensorboard 中) TensorDictMap (在 torchrl.data 中的类) TensorDictMaxValueWriter (在 torchrl.data.replay_buffers 中的类) TensorDictPrimer (在 torchrl.envs.transforms 中的类) TensorDictPrioritizedReplayBuffer (在 torchrl.data 中的类) TensorDictRecorder() (在模块 torchrl.record 中) TensorDictReplayBuffer (在 torchrl.data 中的类) TensorDictRoundRobinWriter (在 torchrl.data.replay_buffers 中的类) TensorDictTokenizer (在 torchrl.data 中的类) TensorMap (在 torchrl.data 中的类) TensorSpec (在 torchrl.data 中的类) TensorStorage (在 torchrl.data.replay_buffers 中的类) TensorStorageCheckpointer (在 torchrl.data.replay_buffers 中的类) terminated_or_truncated() (在模块 torchrl.envs.utils 中) TicTacToeEnv (在 torchrl.envs 中的类) TimeMaxPool (在 torchrl.envs.transforms 中的类) to() (torchrl.data.Binary 方法) (`torchrl.data.BinaryDiscreteTensorSpec` 方法) (`torchrl.data.BinaryToDecimal` 方法) (`torchrl.data.Bounded` 方法) (`torchrl.data.BoundedTensorSpec` 方法) (`torchrl.data.Categorical` 方法) (`torchrl.data.Composite` 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.DiscreteTensorSpec` 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.LazyStackedTensorSpec` 方法) (`torchrl.data.MultiCategorical` 方法) (`torchrl.data.MultiDiscreteTensorSpec` 方法) (`torchrl.data.MultiOneHot` 方法) (`torchrl.data.MultiOneHotDiscreteTensorSpec` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.NonTensor` 方法) (`torchrl.data.NonTensorSpec` 方法) (`torchrl.data.OneHot` 方法) (`torchrl.data.OneHotDiscreteTensorSpec` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.Stacked` 方法) (`torchrl.data.StackedComposite` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.data.TensorSpec` 方法) (`torchrl.data.Unbounded` 方法) (`torchrl.data.UnboundedContinuous` 方法) (`torchrl.data.UnboundedContinuousTensorSpec` 方法) (`torchrl.data.UnboundedDiscrete` 方法) (`torchrl.data.UnboundedDiscreteTensorSpec` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.Compose` 方法) (torchrl.envs.transforms.R3MTransform 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) (`torchrl.envs.transforms.TensorDictPrimer` 方法) (`torchrl.envs.transforms.Transform` 方法) (`torchrl.envs.transforms.TransformedEnv` 方法) (`torchrl.envs.transforms.VC1Transform` 方法) (torchrl.envs.transforms.VIPTransform 方法) (torchrl.modules.tensordict_module.SafeModule 方法) to_categorical() (torchrl.data.Binary 方法) (`torchrl.data.BinaryDiscreteTensorSpec` 方法) (`torchrl.data.Categorical` 方法) (`torchrl.data.DiscreteTensorSpec` 方法) (`torchrl.data.MultiCategorical` 方法) (`torchrl.data.MultiDiscreteTensorSpec` 方法) (`torchrl.data.MultiOneHot` 方法) (`torchrl.data.MultiOneHotDiscreteTensorSpec` 方法) (`torchrl.data.OneHot` 方法) (`torchrl.data.OneHotDiscreteTensorSpec` 方法) to_categorical_spec() (torchrl.data.Binary 方法) (`torchrl.data.BinaryDiscreteTensorSpec` 方法) (`torchrl.data.Categorical` 方法) (`torchrl.data.DiscreteTensorSpec` 方法) (`torchrl.data.MultiCategorical` 方法) (`torchrl.data.MultiDiscreteTensorSpec` 方法) (`torchrl.data.MultiOneHot` 方法) (`torchrl.data.MultiOneHotDiscreteTensorSpec` 方法) (`torchrl.data.OneHot` 方法) (`torchrl.data.OneHotDiscreteTensorSpec` 方法) to_empty() (torchrl.data.BinaryToDecimal 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) to_numpy() (torchrl.data.Binary 方法) (`torchrl.data.BinaryDiscreteTensorSpec` 方法) (`torchrl.data.Bounded` 方法) (`torchrl.data.BoundedTensorSpec` 方法) (`torchrl.data.Categorical` 方法) (`torchrl.data.Composite` 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.DiscreteTensorSpec` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.LazyStackedTensorSpec` 方法) (`torchrl.data.MultiCategorical` 方法) (`torchrl.data.MultiDiscreteTensorSpec` 方法) (`torchrl.data.MultiOneHot` 方法) (`torchrl.data.MultiOneHotDiscreteTensorSpec` 方法) (`torchrl.data.NonTensor` 方法) (`torchrl.data.NonTensorSpec` 方法) (`torchrl.data.OneHot` 方法) (`torchrl.data.OneHotDiscreteTensorSpec` 方法) (`torchrl.data.Stacked` 方法) (`torchrl.data.StackedComposite` 方法) (`torchrl.data.TensorSpec` 方法) (`torchrl.data.Unbounded` 方法) (`torchrl.data.UnboundedContinuous` 方法) (`torchrl.data.UnboundedContinuousTensorSpec` 方法) (`torchrl.data.UnboundedDiscrete` 方法) (`torchrl.data.UnboundedDiscreteTensorSpec` 方法) to_observation_norm() (torchrl.envs.transforms.VecNorm 方法) to_one_hot() (torchrl.data.Binary 方法) (`torchrl.data.BinaryDiscreteTensorSpec` 方法) (`torchrl.data.Categorical` 方法) (`torchrl.data.DiscreteTensorSpec` 方法) (`torchrl.data.MultiCategorical` 方法) (`torchrl.data.MultiDiscreteTensorSpec` 方法) (`torchrl.data.MultiOneHot` 方法) (`torchrl.data.MultiOneHotDiscreteTensorSpec` 方法) (`torchrl.data.OneHot` 方法) (`torchrl.data.OneHotDiscreteTensorSpec` 方法) to_one_hot_spec() (torchrl.data.Binary 方法) (`torchrl.data.BinaryDiscreteTensorSpec` 方法) (`torchrl.data.Categorical` 方法) (`torchrl.data.DiscreteTensorSpec` 方法) (`torchrl.data.MultiCategorical` 方法) (`torchrl.data.MultiDiscreteTensorSpec` 方法) (`torchrl.data.MultiOneHot` 方法) (`torchrl.data.MultiOneHotDiscreteTensorSpec` 方法) (`torchrl.data.OneHot` 方法) (`torchrl.data.OneHotDiscreteTensorSpec` 方法) to_tensordict() (torchrl.data.PairwiseDataset 方法) (`torchrl.data.PromptData` 方法) (`torchrl.data.RewardData` 方法) (`torchrl.data.Tree` 方法) TokenizedDatasetLoader (在 torchrl.data 中的类) Tokenizer (在 torchrl.envs.transforms 中的类) ToTensorImage (在 torchrl.envs.transforms 中的类) train() (torchrl.data.BinaryToDecimal 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) (`torchrl.envs.transforms.TransformedEnv` 方法) Trainer (在 torchrl.trainers 中的类) TrainerHookBase (在 torchrl.trainers 中的类) TrajCounter (在 torchrl.envs.transforms 中的类) Transform (在 torchrl.envs.transforms 中的类) transform_action_spec() (torchrl.envs.transforms.Compose 方法) (`torchrl.envs.transforms.DeviceCastTransform` 方法) (torchrl.envs.transforms.ObservationNorm 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) (`torchrl.envs.transforms.Transform` 方法) (torchrl.envs.transforms.UnaryTransform 方法) (torchrl.envs.transforms.UnsqueezeTransform 方法) transform_done_spec() (torchrl.envs.transforms.DeviceCastTransform 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) (`torchrl.envs.transforms.Stack` 方法) (`torchrl.envs.transforms.Transform` 方法) (torchrl.envs.transforms.UnaryTransform 方法) transform_env_batch_size() (torchrl.envs.transforms.BatchSizeTransform 方法) (`torchrl.envs.transforms.Compose` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) (`torchrl.envs.transforms.Transform` 方法) transform_env_device() (torchrl.envs.transforms.Compose 方法) (`torchrl.envs.transforms.DeviceCastTransform` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) (`torchrl.envs.transforms.Transform` 方法) transform_input_spec() (torchrl.envs.transforms.ActionDiscretizer 方法) (`torchrl.envs.transforms.BatchSizeTransform` 方法) (`torchrl.envs.transforms.Compose` 方法) (`torchrl.envs.transforms.DeviceCastTransform` 方法) (torchrl.envs.transforms.DiscreteActionProjection 方法) (`torchrl.envs.transforms.DTypeCastTransform` 方法) (torchrl.envs.transforms.PermuteTransform 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) (`torchrl.envs.transforms.RemoveEmptySpecs` 方法) (`torchrl.envs.transforms.RenameTransform` 方法) (`torchrl.envs.transforms.RewardSum` 方法) (`torchrl.envs.transforms.Stack` 方法) (`torchrl.envs.transforms.StepCounter` 方法) (`torchrl.envs.transforms.TargetReturn` 方法) (`torchrl.envs.transforms.TensorDictPrimer` 方法) (torchrl.envs.transforms.Tokenizer 方法) (`torchrl.envs.transforms.Transform` 方法) (torchrl.envs.transforms.UnaryTransform 方法) (`torchrl.envs.transforms.VIPRewardTransform` 方法) transform_observation_spec() (torchrl.envs.transforms.CatFrames 方法) (`torchrl.envs.transforms.CatTensors` 方法) (torchrl.envs.transforms.CenterCrop 方法) (torchrl.envs.transforms.ClipTransform 方法) (`torchrl.envs.transforms.Compose` 方法) (torchrl.envs.transforms.Crop 方法) (`torchrl.envs.transforms.DeviceCastTransform` 方法) (`torchrl.envs.transforms.DTypeCastTransform` 方法) (`torchrl.envs.transforms.EndOfLifeTransform` 方法) (`torchrl.envs.transforms.FlattenObservation` 方法) (torchrl.envs.transforms.GrayScale 方法) (`torchrl.envs.transforms.InitTracker` 方法) (torchrl.envs.transforms.ObservationNorm 方法) (torchrl.envs.transforms.PermuteTransform 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) (torchrl.envs.transforms.Resize 方法) (`torchrl.envs.transforms.RewardSum` 方法) (torchrl.envs.transforms.SignTransform 方法) (`torchrl.envs.transforms.Stack` 方法) (`torchrl.envs.transforms.StepCounter` 方法) (`torchrl.envs.transforms.TargetReturn` 方法) (`torchrl.envs.transforms.TensorDictPrimer` 方法) (`torchrl.envs.transforms.TimeMaxPool` 方法) (torchrl.envs.transforms.ToTensorImage 方法) (`torchrl.envs.transforms.TrajCounter` 方法) (`torchrl.envs.transforms.Transform` 方法) (torchrl.envs.transforms.UnaryTransform 方法) (torchrl.envs.transforms.UnsqueezeTransform 方法) (`torchrl.envs.transforms.VC1Transform` 方法) (`torchrl.envs.transforms.VecGymEnvTransform` 方法) (`torchrl.envs.transforms.VecNorm` 方法) transform_output_spec() (torchrl.envs.transforms.BatchSizeTransform 方法) (`torchrl.envs.transforms.Compose` 方法) (`torchrl.envs.transforms.DeviceCastTransform` 方法) (`torchrl.envs.transforms.DTypeCastTransform` 方法) (`torchrl.envs.transforms.ExcludeTransform` 方法) (`torchrl.envs.transforms.KLRewardTransform` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) (`torchrl.envs.transforms.RemoveEmptySpecs` 方法) (`torchrl.envs.transforms.RenameTransform` 方法) (`torchrl.envs.transforms.SelectTransform` 方法) (`torchrl.envs.transforms.StepCounter` 方法) (torchrl.envs.transforms.Tokenizer 方法) (`torchrl.envs.transforms.Transform` 方法) (torchrl.envs.transforms.UnaryTransform 方法) transform_reward_spec() (torchrl.envs.transforms.BinarizeReward 方法) (torchrl.envs.transforms.ClipTransform 方法) (`torchrl.envs.transforms.Compose` 方法) (`torchrl.envs.transforms.DeviceCastTransform` 方法) (torchrl.envs.transforms.LineariseRewards 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) (torchrl.envs.transforms.RewardClipping 方法) (torchrl.envs.transforms.RewardScaling 方法) (`torchrl.envs.transforms.RewardSum` 方法) (torchrl.envs.transforms.SignTransform 方法) (`torchrl.envs.transforms.Stack` 方法) (`torchrl.envs.transforms.Transform` 方法) (torchrl.envs.transforms.UnaryTransform 方法) (torchrl.envs.transforms.UnsqueezeTransform 方法) transform_state_spec() (torchrl.envs.transforms.Compose 方法) (`torchrl.envs.transforms.DeviceCastTransform` 方法) (torchrl.envs.transforms.ObservationNorm 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) (`torchrl.envs.transforms.Transform` 方法) (torchrl.envs.transforms.UnaryTransform 方法) (torchrl.envs.transforms.UnsqueezeTransform 方法) transformed_env_constructor() (在模块 torchrl.trainers.helpers 中) TransformedEnv (在 torchrl.envs.transforms 中的类) Tree (在 torchrl.data 中的类) TruncatedNormal (在 torchrl.modules 中的类) type() (torchrl.data.BinaryToDecimal 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) type_check() (torchrl.data.Binary 方法) (`torchrl.data.BinaryDiscreteTensorSpec` 方法) (`torchrl.data.Bounded` 方法) (`torchrl.data.BoundedTensorSpec` 方法) (`torchrl.data.Categorical` 方法) (`torchrl.data.Composite` 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.DiscreteTensorSpec` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.LazyStackedTensorSpec` 方法) (`torchrl.data.MultiCategorical` 方法) (`torchrl.data.MultiDiscreteTensorSpec` 方法) (`torchrl.data.MultiOneHot` 方法) (`torchrl.data.MultiOneHotDiscreteTensorSpec` 方法) (`torchrl.data.NonTensor` 方法) (`torchrl.data.NonTensorSpec` 方法) (`torchrl.data.OneHot` 方法) (`torchrl.data.OneHotDiscreteTensorSpec` 方法) (`torchrl.data.Stacked` 方法) (`torchrl.data.StackedComposite` 方法) (`torchrl.data.TensorSpec` 方法) (`torchrl.data.Unbounded` 方法) (`torchrl.data.UnboundedContinuous` 方法) (`torchrl.data.UnboundedContinuousTensorSpec` 方法) (`torchrl.data.UnboundedDiscrete` 方法) (`torchrl.data.UnboundedDiscreteTensorSpec` 方法) U UnaryTransform (在 torchrl.envs.transforms 中的类) unbind() (torchrl.data.PairwiseDataset 方法) (`torchrl.data.PromptData` 方法) (`torchrl.data.RewardData` 方法) (`torchrl.data.Tree` 方法) Unbounded (在 torchrl.data 中的类) UnboundedContinuous (在 torchrl.data 中的类) UnboundedContinuousTensorSpec (在 torchrl.data 中的类) UnboundedDiscrete (在 torchrl.data 中的类) UnboundedDiscreteTensorSpec (在 torchrl.data 中的类) unflatten() (torchrl.data.Binary 方法) (`torchrl.data.BinaryDiscreteTensorSpec` 方法) (`torchrl.data.Bounded` 方法) (`torchrl.data.BoundedTensorSpec` 方法) (`torchrl.data.Categorical` 方法) (`torchrl.data.Composite` 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.DiscreteTensorSpec` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.LazyStackedTensorSpec` 方法) (`torchrl.data.MultiCategorical` 方法) (`torchrl.data.MultiDiscreteTensorSpec` 方法) (`torchrl.data.MultiOneHot` 方法) (`torchrl.data.MultiOneHotDiscreteTensorSpec` 方法) (`torchrl.data.NonTensor` 方法) (`torchrl.data.NonTensorSpec` 方法) (`torchrl.data.OneHot` 方法) (`torchrl.data.OneHotDiscreteTensorSpec` 方法) (`torchrl.data.Stacked` 方法) (`torchrl.data.StackedComposite` 方法) (`torchrl.data.TensorSpec` 方法) (`torchrl.data.Unbounded` 方法) (`torchrl.data.UnboundedContinuous` 方法) (`torchrl.data.UnboundedContinuousTensorSpec` 方法) (`torchrl.data.UnboundedDiscrete` 方法) (`torchrl.data.UnboundedDiscreteTensorSpec` 方法) unfreeze() (torchrl.envs.transforms.VecNorm 方法) UnityMLAgentsEnv() (在模块 torchrl.envs 中) UnityMLAgentsWrapper() (在模块 torchrl.envs 中) unlock_() (torchrl.data.Composite 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.StackedComposite` 方法) unsqueeze() (torchrl.data.Binary 方法) (`torchrl.data.BinaryDiscreteTensorSpec` 方法) (`torchrl.data.Bounded` 方法) (`torchrl.data.BoundedTensorSpec` 方法) (`torchrl.data.Categorical` 方法) (`torchrl.data.Composite` 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.DiscreteTensorSpec` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.LazyStackedTensorSpec` 方法) (`torchrl.data.MultiCategorical` 方法) (`torchrl.data.MultiDiscreteTensorSpec` 方法) (`torchrl.data.MultiOneHot` 方法) (`torchrl.data.MultiOneHotDiscreteTensorSpec` 方法) (`torchrl.data.NonTensor` 方法) (`torchrl.data.NonTensorSpec` 方法) (`torchrl.data.OneHot` 方法) (`torchrl.data.OneHotDiscreteTensorSpec` 方法) (`torchrl.data.Stacked` 方法) (`torchrl.data.StackedComposite` 方法) (`torchrl.data.TensorSpec` 方法) (`torchrl.data.Unbounded` 方法) (`torchrl.data.UnboundedContinuous` 方法) (`torchrl.data.UnboundedContinuousTensorSpec` 方法) (`torchrl.data.UnboundedDiscrete` 方法) (`torchrl.data.UnboundedDiscreteTensorSpec` 方法) UnsqueezeTransform (在 torchrl.envs.transforms 中的类) update() (torchrl.data.AdaptiveKLController 方法) update_kwargs() (torchrl.envs.ParallelEnv 方法) (`torchrl.envs.SerialEnv` 方法) update_mask() (torchrl.data.Binary 方法) (`torchrl.data.BinaryDiscreteTensorSpec` 方法) (`torchrl.data.Categorical` 方法) (`torchrl.data.DiscreteTensorSpec` 方法) (`torchrl.data.MultiCategorical` 方法) (`torchrl.data.MultiDiscreteTensorSpec` 方法) (`torchrl.data.MultiOneHot` 方法) (`torchrl.data.MultiOneHotDiscreteTensorSpec` 方法) (`torchrl.data.OneHot` 方法) (`torchrl.data.OneHotDiscreteTensorSpec` 方法) update_policy_weights_() (torchrl.collectors.aSyncDataCollector 方法) (torchrl.collectors.DataCollectorBase 方法) (torchrl.collectors.distributed.DistributedDataCollector 方法) (torchrl.collectors.distributed.DistributedSyncDataCollector 方法) (`torchrl.collectors.distributed.RayCollector` 方法) (torchrl.collectors.distributed.RPCDataCollector 方法) (`torchrl.collectors.MultiaSyncDataCollector` 方法) (`torchrl.collectors.MultiSyncDataCollector` 方法) (`torchrl.collectors.SyncDataCollector` 方法) update_priority() (torchrl.data.replay_buffers.PrioritizedSampler 方法) (torchrl.data.replay_buffers.PrioritizedSliceSampler 方法) UpdateWeights (在 torchrl.trainers 中的类) V valid_paths() (torchrl.data.Tree 方法) value_estimate() (torchrl.objectives.value.GAE 方法) (`torchrl.objectives.value.TD0Estimator` 方法) (`torchrl.objectives.value.TD1Estimator` 方法) (`torchrl.objectives.value.TDLambdaEstimator` 方法) (`torchrl.objectives.value.ValueEstimatorBase` 方法) value_estimator (torchrl.objectives.LossModule 属性) ValueEstimatorBase (在 torchrl.objectives.value 中的类) ValueEstimators (在 torchrl.objectives 中的类) ValueOperator (在 torchrl.modules.tensordict_module 中的类) values() (torchrl.data.Composite 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.StackedComposite` 方法) VC1Transform (在 torchrl.envs.transforms 中的类) VD4RLExperienceReplay (在 torchrl.data.datasets 中的类) VDNMixer (在 torchrl.modules 中的类) vec_generalized_advantage_estimate (在 torchrl.objectives.value.functional 中的类) vec_td1_advantage_estimate (在 torchrl.objectives.value.functional 中的类) vec_td1_return_estimate (在 torchrl.objectives.value.functional 中的类) vec_td_lambda_advantage_estimate (在 torchrl.objectives.value.functional 中的类) vec_td_lambda_return_estimate (在 torchrl.objectives.value.functional 中的类) VecGymEnvTransform (在 torchrl.envs.transforms 中的类) VecNorm (在 torchrl.envs.transforms 中的类) vertices() (torchrl.data.Tree 方法) VideoRecorder() (在模块 torchrl.record 中) view() (torchrl.data.Binary 方法) (`torchrl.data.BinaryDiscreteTensorSpec` 方法) (`torchrl.data.Bounded` 方法) (`torchrl.data.BoundedTensorSpec` 方法) (`torchrl.data.Categorical` 方法) (`torchrl.data.Composite` 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.DiscreteTensorSpec` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.LazyStackedTensorSpec` 方法) (`torchrl.data.MultiCategorical` 方法) (`torchrl.data.MultiDiscreteTensorSpec` 方法) (`torchrl.data.MultiOneHot` 方法) (`torchrl.data.MultiOneHotDiscreteTensorSpec` 方法) (`torchrl.data.NonTensor` 方法) (`torchrl.data.NonTensorSpec` 方法) (`torchrl.data.OneHot` 方法) (`torchrl.data.OneHotDiscreteTensorSpec` 方法) (`torchrl.data.Stacked` 方法) (`torchrl.data.StackedComposite` 方法) (`torchrl.data.TensorSpec` 方法) (`torchrl.data.Unbounded` 方法) (`torchrl.data.UnboundedContinuous` 方法) (`torchrl.data.UnboundedContinuousTensorSpec` 方法) (`torchrl.data.UnboundedDiscrete` 方法) (`torchrl.data.UnboundedDiscreteTensorSpec` 方法) VIPRewardTransform (在 torchrl.envs.transforms 中的类) VIPTransform (在 torchrl.envs.transforms 中的类) visits (torchrl.data.Tree 属性) vmap_randomness (torchrl.objectives.LossModule 属性) VmapModule (在 torchrl.modules 中的类) VmasEnv() (在模块 torchrl.envs 中) VmasWrapper() (在模块 torchrl.envs 中) W WandbLogger() (在模块 torchrl.record.loggers.wandb 中) WorldModelWrapper (在 torchrl.modules.tensordict_module 中的类) write_count (torchrl.data.datasets.AtariDQNExperienceReplay 属性) (`torchrl.data.datasets.BaseDatasetExperienceReplay` 属性) (`torchrl.data.datasets.D4RLExperienceReplay` 属性) (`torchrl.data.datasets.GenDGRLExperienceReplay` 属性) (`torchrl.data.datasets.MinariExperienceReplay` 属性) (`torchrl.data.datasets.OpenMLExperienceReplay` 属性) (`torchrl.data.datasets.OpenXExperienceReplay` 属性) (`torchrl.data.datasets.RobosetExperienceReplay` 属性) (`torchrl.data.datasets.VD4RLExperienceReplay` 属性) (torchrl.data.PrioritizedReplayBuffer 属性) (torchrl.data.replay_buffers.ReplayBufferEnsemble 属性) (torchrl.data.ReplayBuffer 属性) (torchrl.data.TensorDictPrioritizedReplayBuffer 属性) (torchrl.data.TensorDictReplayBuffer 属性) Writer (在 torchrl.data.replay_buffers 中的类) writer (torchrl.data.datasets.AtariDQNExperienceReplay 属性) (`torchrl.data.datasets.BaseDatasetExperienceReplay` 属性) (`torchrl.data.datasets.D4RLExperienceReplay` 属性) (`torchrl.data.datasets.GenDGRLExperienceReplay` 属性) (`torchrl.data.datasets.MinariExperienceReplay` 属性) (`torchrl.data.datasets.OpenMLExperienceReplay` 属性) (`torchrl.data.datasets.OpenXExperienceReplay` 属性) (`torchrl.data.datasets.RobosetExperienceReplay` 属性) (`torchrl.data.datasets.VD4RLExperienceReplay` 属性) (torchrl.data.PrioritizedReplayBuffer 属性) (torchrl.data.replay_buffers.ReplayBufferEnsemble 属性) (torchrl.data.ReplayBuffer 属性) (torchrl.data.TensorDictPrioritizedReplayBuffer 属性) (torchrl.data.TensorDictReplayBuffer 属性) WriterEnsemble (在 torchrl.data.replay_buffers 中的类) X xpu() (torchrl.data.BinaryToDecimal 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) Z zero() (torchrl.data.Binary 方法) (`torchrl.data.BinaryDiscreteTensorSpec` 方法) (`torchrl.data.Bounded` 方法) (`torchrl.data.BoundedTensorSpec` 方法) (`torchrl.data.Categorical` 方法) (`torchrl.data.Composite` 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.DiscreteTensorSpec` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.LazyStackedTensorSpec` 方法) (`torchrl.data.MultiCategorical` 方法) (`torchrl.data.MultiDiscreteTensorSpec` 方法) (`torchrl.data.MultiOneHot` 方法) (`torchrl.data.MultiOneHotDiscreteTensorSpec` 方法) (`torchrl.data.NonTensor` 方法) (`torchrl.data.NonTensorSpec` 方法) (`torchrl.data.OneHot` 方法) (`torchrl.data.OneHotDiscreteTensorSpec` 方法) (`torchrl.data.Stacked` 方法) (`torchrl.data.StackedComposite` 方法) (`torchrl.data.TensorSpec` 方法) (`torchrl.data.Unbounded` 方法) (`torchrl.data.UnboundedContinuous` 方法) (`torchrl.data.UnboundedContinuousTensorSpec` 方法) (`torchrl.data.UnboundedDiscrete` 方法) (`torchrl.data.UnboundedDiscreteTensorSpec` 方法) zero_grad() (torchrl.data.BinaryToDecimal 方法) (`torchrl.data.HashToInt` 方法) (`torchrl.data.MultiStep` 方法) (`torchrl.data.QueryModule` 方法) (`torchrl.data.RandomProjectionHash` 方法) (`torchrl.data.SipHash` 方法) (`torchrl.data.TensorDictMap` 方法) (`torchrl.envs.ChessEnv` 方法) (`torchrl.envs.EnvBase` 方法) (`torchrl.envs.GymLikeEnv` 方法) (`torchrl.envs.LLMHashingEnv` 方法) (`torchrl.envs.ParallelEnv` 方法) (`torchrl.envs.PendulumEnv` 方法) (`torchrl.envs.SerialEnv` 方法) (`torchrl.envs.TicTacToeEnv` 方法) (`torchrl.envs.transforms.rb_transforms.MultiStepTransform` 方法) zeros() (torchrl.data.Binary 方法) (`torchrl.data.BinaryDiscreteTensorSpec` 方法) (`torchrl.data.Bounded` 方法) (`torchrl.data.BoundedTensorSpec` 方法) (`torchrl.data.Categorical` 方法) (`torchrl.data.Composite` 方法) (`torchrl.data.CompositeSpec` 方法) (`torchrl.data.DiscreteTensorSpec` 方法) (`torchrl.data.LazyStackedCompositeSpec` 方法) (`torchrl.data.LazyStackedTensorSpec` 方法) (`torchrl.data.MultiCategorical` 方法) (`torchrl.data.MultiDiscreteTensorSpec` 方法) (`torchrl.data.MultiOneHot` 方法) (`torchrl.data.MultiOneHotDiscreteTensorSpec` 方法) (`torchrl.data.NonTensor` 方法) (`torchrl.data.NonTensorSpec` 方法) (`torchrl.data.OneHot` 方法) (`torchrl.data.OneHotDiscreteTensorSpec` 方法) (`torchrl.data.Stacked` 方法) (`torchrl.data.StackedComposite` 方法) (`torchrl.data.TensorSpec` 方法) (`torchrl.data.Unbounded` 方法) (`torchrl.data.UnboundedContinuous` 方法) (`torchrl.data.UnboundedContinuousTensorSpec` 方法) (`torchrl.data.UnboundedDiscrete` 方法) (`torchrl.data.UnboundedDiscreteTensorSpec` 方法)