TorchRL¶

TorchRL 是一个用于 PyTorch 的开源强化学习 (RL) 库。
你可以直接从 PyPI 安装 TorchRL(更多安装说明请参阅下方专门章节)。
$ pip install torchrl
TorchRL 提供了 PyTorch 和 Python 优先的、低级别和高级别的 RL 抽象,旨在实现高效、模块化、有文档和经过适当测试。其代码旨在支持 RL 研究。大部分代码使用高度模块化的方式用 Python 编写,以便研究人员可以轻松地替换组件、对其进行转换或轻松编写新组件。
这个 repo 试图与现有的 PyTorch 生态系统库对齐,因为它拥有“数据集支柱”(环境)、transforms、模型、数据工具(例如采集器和容器)等。TorchRL 旨在尽可能少地依赖外部库(仅需 Python 标准库、numpy 和 PyTorch)。常见的环境库(例如 OpenAI gym)是可选的。
在低级别方面,TorchRL 提供了一套高度可重用的函数式工具,用于成本函数、回报和数据处理。
TorchRL 旨在实现高度模块化和良好的运行时性能。
要了解更多关于 TorchRL 的设计理念和超出本 API 参考的功能,请查阅TorchRL 论文。
安装¶
TorchRL 版本与 PyTorch 同步发布,因此请确保始终使用最新版本的 PyTorch,以享受库的最新功能(尽管核心功能保证向后兼容 PyTorch>=2.0)。夜间版本可以通过以下方式安装:
$ pip install tensordict-nightly
$ pip install torchrl-nightly
pip install torchrl-nightly
$ cd path/to/root
$ git clone https://github.com/pytorch/tensordict
$ git clone https://github.com/pytorch/rl
$ cd tensordict
$ python setup.py develop
$ cd ../rl
$ python setup.py develop
入门¶
一系列快速教程,帮助您快速掌握库的基本功能。如果您赶时间,可以从本系列教程的最后一项开始,并在需要时随时回顾前面的内容!