食谱概述¶
食谱是 torchtune 用户的主要入口点。这些可以被认为是可 hack 的、专注于单一用途的脚本,用于与 LLM 交互,包括微调、推理、评估和量化。
每个食谱包含三个组成部分
可配置参数,通过 yaml 配置文件和命令行覆盖指定
食谱脚本,入口点,将所有内容放在一起,包括解析和验证配置、设置环境以及正确使用食谱类
食谱类,微调所需的核心逻辑,通过一组 API 公开
注意
要详细了解“食谱”的概念,请查看我们的技术深入探讨:什么是食谱?。
微调¶
我们的食谱包括
单设备全量微调
分布式全量微调
分布式 LoRA 微调
近端策略优化 (PPO)
如需完整列表,请运行
tune ls
注意
我们的食谱文档目前正在建设中。请随时关注我们在跟踪问题 此处 的进展。