了解 PyTorch 生态系统的各个组成部分
Torchaudio 是一个用于 PyTorch 音频和信号处理的库。它提供 I/O、信号和数据处理功能、数据集、模型实现和应用程序组件。
一个专为微调大型语言模型(LLM)而设计的 PyTorch 原生库。torchtune 支持完整的微调工作流,并与主流的生产推理系统兼容。
该库是 PyTorch 项目的一部分。PyTorch 是一个开源机器学习框架。torchvision 包含用于计算机视觉的流行数据集、模型架构和常用图像变换。
TorchRec 是一个 PyTorch 领域库,旨在为大规模推荐系统(RecSys)提供所需的常见稀疏性和并行性原语。它允许开发者训练具有跨多个 GPU 分片的大型嵌入表的模型。
一个用于快速媒体解码和编码的 PyTorch 库。当在音频和视频上运行 PyTorch 模型时,我们推荐使用 torchcodec 将音频和视频文件转换为模型可以使用的数据。
一个 Beta 版库,包含常见的模块化数据加载原语,可用于轻松构建灵活且高性能的数据管道。其中一些功能仍处于原型阶段。
torchrl 是一个开源的、Python 优先的 PyTorch 强化学习库,专注于高模块化和良好的运行时性能,为成本函数、回报和数据处理提供低级和高级的强化学习抽象以及可重用的函数。
tensordict 是一个类似字典的类,它简化了对批量张量的操作,通过抽象定制化操作并在叶节点上自动分派操作,提高了代码的可读性、紧凑性和模块化,并减少了错误。
PyTorch 可以通过 torch_xla 包在 XLA 设备(如 TPU)上运行。本文档介绍了如何在这些设备上运行您的模型。