快捷方式

parse_hf_tokenizer_json

torchtune.modules.transforms.tokenizers.parse_hf_tokenizer_json(tokenizer_json_path: str) Dict[str, int][source]

解析来自 Hugging Face 模型的 tokenizer.json 文件,提取特殊 token 字符串到 ID 的映射。

参数:

tokenizer_json_path (str) – tokenizer.json 文件的路径。

返回:

特殊 token 字符串到 ID 的映射。

返回类型:

Dict[str, int]

文档

获取 PyTorch 全面的开发者文档

查看文档

教程

获取面向初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并获得问题的解答

查看资源