了解 PyTorch 生态系统的各个部分
Torchaudio 是一个用于音频和信号处理的 PyTorch 库。它提供了输入/输出、信号和数据处理函数、数据集、模型实现以及应用程序组件。
这是一个专为微调大语言模型 (LLM) 而设计的 PyTorch 原生库。torchtune 支持完整的微调工作流程,并提供与主流生产推理系统的兼容性。
该库是 PyTorch 项目的一部分。PyTorch 是一个开源机器学习框架。torchvision 包由计算机视觉中常用的数据集、模型架构和图像转换方法组成。
TorchRec 是一个 PyTorch 领域库,旨在为大规模推荐系统 (RecSys) 提供所需的通用稀疏性和并行性原语。它允许作者训练将大型嵌入表分片(sharded)到多个 GPU 上的模型。
一个用于快速媒体编解码的 PyTorch 库。在运行音频和视频的 PyTorch 模型时,torchcodec 是我们将音频和视频文件转换为模型可用数据的推荐方式。
一个用于构建灵活且高性能数据管道的通用模块化数据加载原语的 Beta 版库。此外,还有一些功能仍处于原型阶段。
torchrl 是一个开源的、以 Python 为优先的 PyTorch 强化学习库,专注于高模块化和良好的运行时性能,提供低级和高级的 RL 抽象,以及用于成本函数、回报和数据处理的可重用功能。
tensordict 是一个类似字典的类,它简化了张量批次上的操作,通过抽象定制操作并自动调度叶子节点上的操作来减少错误,从而增强了代码的可读性、紧凑性和模块化。
PyTorch 可以通过 torch_xla 包在 TPU 等 XLA 设备上运行。本文档介绍了如何在这些设备上运行您的模型。