ChosenRejectedToMessages¶
- class torchtune.data.ChosenRejectedToMessages(train_on_input: bool = False, column_map: Optional[Dict[str, str]] = None, new_system_prompt: Optional[str] = None)[source]¶
用于将包含对话的“chosen”和“rejected”列的数据集中的单个样本转换为选定消息和拒绝消息列表的转换。例如
| chosen | rejected | |----------------------------------------|----------------------------------------| | [{"role": "user", "content": Q1}, | [{"role": "user", "content": Q1}, | | {"role": "assistant", "content": A1}] | {"role": "assistant", "content": A2}] |
将转换为
chosen = [ Message(role="user", content="Q1"), Message(role="assistant", content="A1"), ] rejected = [ Message(role="user", content="Q1"), Message(role="assistant", content="A2"), ]
单个样本通常包含一个可选的系统提示和一个或多个轮次的使用者和助手消息。
- 参数:
- 引发:
ValueError – 如果提供
column_map
且chosen
不在column_map
中,或者rejected
不在column_map
中。