alpaca_cleaned_dataset¶

torchtune.datasets.alpaca_cleaned_dataset(tokenizer: ModelTokenizer, *, source: str = 'yahma/alpaca-cleaned', column_map: Optional[Dict[str, str]] = None, train_on_input: bool = True, packed: bool = False, filter_fn: Optional[Callable] = None, split: str = 'train', **load_dataset_kwargs: Dict[str, Any]) → Union[SFTDataset, PackedDataset]¶: 这是 Alpaca 风格数据集的一个变体构建器，使用了原始 Alpaca 数据集的清理版本，即 yahma/alpaca-cleaned。有关更多详细信息，请参阅数据集页面和 alpaca_dataset()。

文档