配方总览¶
配方是 torchtune 用户的主要入口点。可以将其视为可修改的、专注于与 LLM 交互的脚本,包括微调、推理、评估和量化。
每个配方包含三个组件
可配置参数,通过 yaml 配置和命令行覆盖指定
配方脚本,入口点,将所有内容整合在一起,包括解析和验证配置、设置环境以及正确使用配方类
配方类,微调所需的核心逻辑,通过一组 API 公开
注意
要了解更多关于“配方”的概念,请查阅我们的技术深度探究:什么是配方?。
微调¶
我们的配方包括
单设备完全微调
分布式完全微调
分布式 LoRA 微调
近端策略优化 (PPO)
有关完整列表,请运行
tune ls
注意
我们的配方文档目前正在建设中。请随时在我们的跟踪问题 此处 关注进展。