了解 PyTorch 生态系统的各个组成部分
Torchaudio 是一个用于 PyTorch 音频和信号处理的库。它提供 I/O、信号和数据处理功能、数据集、模型实现以及应用程序组件。
一个为大型语言模型 (LLM) 微调而设计的 PyTorch 原生库。torchtune 支持完整的微调工作流程,并提供与流行生产推理系统的兼容性。
该库是 PyTorch 项目的一部分。PyTorch 是一个开源机器学习框架。torchvision 包包含流行的数据集、模型架构以及计算机视觉中常用的图像变换。
TorchRec 是一个 PyTorch 领域库,旨在提供大型推荐系统 (RecSys) 所需的常见稀疏性和并行性原语。它允许开发者训练模型,其中包含分片到多个 GPU 上的大型嵌入表。
一个用于快速媒体解码和编码的 PyTorch 库。当在音频和视频上运行 PyTorch 模型时,torchcodec 是我们将音频和视频文件转换为模型可用数据的推荐方式。
一个测试版库,包含常用的模块化数据加载原语,用于轻松构建灵活且高性能的数据管道。此外,还有一些功能仍处于原型阶段。
torchrl 是一个开源的、Python 优先的 PyTorch 强化学习库,专注于高模块化和良好的运行时性能,提供低级和高级 RL 抽象以及用于成本函数、回报和数据处理的可重用功能。
tensordict 是一个类似字典的类,它简化了对张量批次的操作,通过抽象定制操作并通过对叶子进行自动操作调度来减少错误,从而增强了代码的可读性、紧凑性和模块化。
PyTorch 通过 torch_xla 包在 XLA 设备(如 TPU)上运行。本文档描述了如何在这些设备上运行模型。