llama2_reward_7b¶
- torchtune.models.llama2.llama2_reward_7b() TransformerDecoder [source]¶
用于创建 Llama2 模型的构建器,该模型使用来自 https://arxiv.org/abs/2307.09288 的默认 7B 参数值进行初始化,其中输出层是一个分类层,投影到单个类别以进行奖励建模。
- 返回:
Llama2 7B 模型的实例
- 返回类型:
用于创建 Llama2 模型的构建器,该模型使用来自 https://arxiv.org/abs/2307.09288 的默认 7B 参数值进行初始化,其中输出层是一个分类层,投影到单个类别以进行奖励建模。
Llama2 7B 模型的实例