torchtune 概述¶

在本页中，我们将介绍 torchtune 的概述，包括功能、关键概念和附加指针。

什么是 torchtune？¶

torchtune 是一个 PyTorch 库，用于轻松编写、微调和试验 LLM。该库强调 4 个关键方面

torchtune 提供

兴奋吗？要开始，请查看我们的部分教程，包括

在您浏览教程和代码时，有两个概念将帮助您更好地理解和使用 torchtune。

配置。 YAML 文件帮助您配置训练设置（数据集、模型、检查点）和超参数（批次大小、学习率），无需修改代码。有关更多信息，请参阅关于配置的深入了解。

配方。 配方可以被认为是针对大型语言模型训练和可选评估的端到端管道。每个配方都实现了一种训练方法（例如：完全微调），并应用了一组有意义的功能（例如：FSDP + 激活检查点 + 梯度累积 + 降低精度训练）到给定的模型系列（例如：Llama2）。有关更多信息，请参阅什么是配方？深入了解。

torchtune 体现了 PyTorch 的设计理念，尤其是“可用性高于一切”。

原生 PyTorch

torchtune 是一个原生 PyTorch 库。虽然我们提供了与周围生态系统（例如：Hugging Face 数据集、EleutherAI 评估工具）的集成，但所有核心功能都是用 PyTorch 编写的。

简单性和可扩展性

torchtune 的设计易于理解、使用和扩展。

正确性

torchtune 提供经过良好测试的组件，对正确性有很高的要求。该库永远不会是第一个提供功能的库，但可用功能将经过彻底测试。我们提供