数据集概览¶
torchtune 允许您使用 Hugging Face Hub 上、本地下载或远程 URL 上的任何数据集来微调大型语言模型 (LLM) 和视觉语言模型 (VLM)。我们提供了内置的数据集构建器,可帮助您快速启动微调项目,支持的工作流程包括指令微调、偏好对齐、持续预训练等。除此之外,torchtune 还为您的数据集管道提供了全面的可定制性,允许您训练任何数据格式或模式。
支持以下任务:
数据管道¶
从原始数据样本到训练范例中的模型输入,所有 torchtune 数据集都遵循相同的管道: