快捷方式

torchtune.data

文本模板

用于指示提示和聊天提示的模板。包括一些针对不同数据集和模型的特定格式。

InstructTemplate

用于指示模板的接口。

AlpacaInstructTemplate

Alpaca 风格数据集的提示模板。

GrammarErrorCorrectionTemplate

用于语法校正数据集的提示模板。

SummarizeTemplate

提示模板,用于将数据集格式化为摘要任务。

StackExchangedPairedTemplate

类似于 StackExchangedPaired 的偏好数据集的提示模板。

ChatFormat

用于聊天格式的接口。

ChatMLFormat

OpenAI 的 聊天标记语言,由他们的聊天模型使用。

Llama2ChatFormat

聊天格式,使用 Llama2 预训练中使用的适当标签格式化人和系统提示。

MistralChatFormat

根据 Mistral 的指示模型 格式化。

类型

消息

此数据类表示指令或聊天数据集中单个消息。

转换器

将数据从常见的 JSON 格式转换为 torchtune Message

get_sharegpt_messages

将遵循 ShareGPT json 结构的聊天样本转换为 torchtune 的 Message 结构。

get_openai_messages

将遵循 OpenAI API json 结构的聊天样本转换为 torchtune 的 Message 结构。

辅助函数

用于修改数据的各种辅助函数。

validate_messages

给定一个消息列表,确保消息形成有效的来回对话。

truncate

将令牌列表截断到最大长度。

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取针对初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并获取答案

查看资源