配方概述¶
配方是 torchtune 用户的主要切入点。可以将它们视为**用于与 LLM 交互的可修改、专注于单一目标的脚本**,包括微调、推理、评估和量化。
每个配方包含三个组件
可配置参数,通过 yaml 配置文件和命令行覆盖指定
配方脚本,入口点,将所有内容整合在一起,包括解析和验证配置、设置环境以及正确使用配方类
配方类,微调所需的核心逻辑,通过一组 API 公开
注意
要详细了解“配方”的概念,请查看我们的技术深入探讨:什么是配方?。
微调¶
我们的配方包括
单设备完整微调
分布式完整微调
分布式 LoRA 微调
直接偏好优化 (DPO)
近端策略优化 (PPO)
有关完整列表,请运行
tune ls
注意
我们的配方文档目前正在构建中。请随时关注我们跟踪器问题中的进度此处。