ChosenRejectedToMessages¶
- class torchtune.data.ChosenRejectedToMessages(train_on_input: bool = False, column_map: Optional[Dict[str, str]] = None, new_system_prompt: Optional[str] = None)[source]¶
用于转换来自数据集的单个样本的变换,数据集带有包含对话的“chosen”和“rejected”列,转换为已选择和已拒绝消息的列表。例如
| chosen | rejected | |----------------------------------------|----------------------------------------| | [{"role": "user", "content": Q1}, | [{"role": "user", "content": Q1}, | | {"role": "assistant", "content": A1}] | {"role": "assistant", "content": A2}] |
将被转换为
chosen = [ Message(role="user", content="Q1"), Message(role="assistant", content="A1"), ] rejected = [ Message(role="user", content="Q1"), Message(role="assistant", content="A2"), ]
单个样本通常由单个可选的系统提示以及一轮或多轮用户和助手消息组成。
- 参数:
- Raises:
ValueError – 如果提供了
column_map
且chosen
不在column_map
中,或者rejected
不在column_map
中。