快捷方式

parse_hf_tokenizer_json

torchtune.modules.tokenizers.parse_hf_tokenizer_json(tokenizer_json_path: str) Dict[str, int][source]

从 Hugging Face 模型解析 tokenizer.json 文件以提取特殊标记字符串到 ID 的映射。

参数:

tokenizer_json_path (str) – tokenizer.json 文件的路径。

返回:

特殊标记字符串到 ID 的映射。

返回类型:

Dict[str, int]

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获得问题的解答

查看资源