qwen2_5_3b¶
- torchtune.models.qwen2_5.qwen2_5_3b() TransformerDecoder [源代码]¶
用于创建 Qwen2.5 模型(基础或指令)的构建器,使用 https://hugging-face.cn/Qwen/Qwen2.5-3B-Instruct 中的默认 3B 参数值初始化
- 返回:
Qwen2.5 3B 模型的实例化
- 返回类型:
注意
Qwen2.5 0.5B-3B 模型构建器将默认启用
tie_word_embeddings
(参见qwen2()
)