快捷方式

parse_hf_tokenizer_json

torchtune.modules.tokenizers.parse_hf_tokenizer_json(tokenizer_json_path: str) Dict[str, int][源代码]

解析 Hugging Face 模型的 tokenizer.json 文件,以提取特殊 token 字符串到 id 的映射。

参数:

tokenizer_json_path (str) – tokenizer.json 文件的路径。

返回:

特殊 token 字符串到 id 的映射。

返回类型:

Dict[str, int]

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取面向初学者和高级开发者的深度教程

查看教程

资源

查找开发资源并获得您的问题解答

查看资源