llama2_reward_7b¶
- torchtune.models.llama2.llama2_reward_7b() TransformerDecoder [来源]¶
用于创建 Llama2 模型的构建器,该模型使用来自 https://arxiv.org/abs/2307.09288 的默认 7B 参数值进行初始化,其中输出层是一个分类层,用于预测单个类别的奖励建模。
- 返回值:
Llama2 7B 模型的实例化
- 返回类型:
用于创建 Llama2 模型的构建器,该模型使用来自 https://arxiv.org/abs/2307.09288 的默认 7B 参数值进行初始化,其中输出层是一个分类层,用于预测单个类别的奖励建模。
Llama2 7B 模型的实例化