TorchRL¶

TorchRL 是一个用于 PyTorch 的开源强化学习 (RL) 库。
您可以直接从 PyPI 安装 TorchRL(有关安装说明的更多信息,请参阅下面的专用部分)
$ pip install torchrl
TorchRL 为 RL 提供 pytorch 和 python 优先的、低级和高级抽象,旨在高效、模块化、文档完善且经过适当测试。该代码旨在支持 RL 研究。其中大部分是用 python 以高度模块化的方式编写的,这样研究人员可以轻松地交换组件、转换它们或轻松编写新的组件。
此仓库尝试与现有的 pytorch 生态系统库保持一致,因为它具有“数据集支柱” (环境)、转换、模型、数据实用程序(例如收集器和容器)等。TorchRL 旨在尽可能减少依赖项(python 标准库、numpy 和 pytorch)。常用环境库(例如 OpenAI gym)只是可选的。
在低级端,torchrl 附带了一组高度可重用的函数,用于成本函数、回报和数据处理。
TorchRL 旨在实现高模块化和良好的运行时性能。
要阅读有关 TorchRL 理念和超出此 API 参考的功能的更多信息,请查看 TorchRL 论文。
安装¶
TorchRL 版本与 PyTorch 同步,因此请确保您始终通过 最新版本的 PyTorch 享受该库的最新功能(尽管核心功能保证向后兼容 pytorch>=2.0)。可以通过以下方式安装每晚构建版本
$ pip install tensordict-nightly
$ pip install torchrl-nightly
或者如果您愿意为库做出贡献,可以通过 git clone
安装
$ cd path/to/root
$ git clone https://github.com/pytorch/tensordict
$ git clone https://github.com/pytorch/rl
$ cd tensordict
$ python setup.py develop
$ cd ../rl
$ python setup.py develop
入门¶
一系列快速教程,让您快速上手该库的基本功能。如果您时间紧迫,可以从本系列的最后一项开始,并在您想了解更多信息时导航到之前的项目!