TorchRL¶
TorchRL 是一个用于 PyTorch 的开源强化学习 (RL) 库。
您可以直接从 PyPI 安装 TorchRL(有关安装说明,请参阅下面专门的部分)
$ pip install torchrl
TorchRL 为 RL 提供了优先使用 PyTorch 和 Python 的低级和高级抽象,旨在高效、模块化、有文档记录并经过适当测试。该代码旨在支持 RL 领域的研究。大部分代码是用 Python 以高度模块化的方式编写的,以便研究人员可以轻松地交换组件、转换它们或编写新的组件,而无需付出太多努力。
此存储库试图与现有的 PyTorch 生态系统库保持一致,因为它具有“数据集支柱” (环境)、转换、模型、数据实用程序(例如收集器和容器)等。TorchRL 旨在尽可能减少依赖项(Python 标准库、NumPy 和 PyTorch)。常见的环境库(例如 OpenAI Gym)仅是可选的。
在低级方面,TorchRL 带有一组高度可重用的函数,用于 成本函数、回报 和数据处理。
TorchRL 旨在实现高模块化和良好的运行时性能。
要了解有关 TorchRL 理念和超出此 API 参考的功能的更多信息,请查看 TorchRL 论文。
安装¶
TorchRL 版本与 PyTorch 同步,因此请确保您始终使用 最新版本的 PyTorch 来享受库的最新功能(尽管核心功能保证与 pytorch>=2.0 向后兼容)。可以通过以下方式安装每日构建版本
$ pip install tensordict-nightly
$ pip install torchrl-nightly
或者如果您愿意为库做出贡献,可以通过 git clone
$ cd path/to/root
$ git clone https://github.com/pytorch/tensordict
$ git clone https://github.com/pytorch/rl
$ cd tensordict
$ python setup.py develop
$ cd ../rl
$ python setup.py develop
入门¶
一系列快速教程,帮助您快速上手该库的基本功能。如果您时间紧迫,可以从 系列的最后一项 开始,并在您想了解更多信息时浏览前面的内容!