llama2_reward_7b¶
- torchtune.models.llama2.llama2_reward_7b() TransformerDecoder [source]¶
用于创建一个 Llama2 模型,该模型使用来自 https://arxiv.org/abs/2307.09288 的默认 7B 参数值进行初始化,其中输出层是投影到单个类别用于奖励建模的分类层。
- 返回值:
Llama2 7B 模型的实例
- 返回类型:
用于创建一个 Llama2 模型,该模型使用来自 https://arxiv.org/abs/2307.09288 的默认 7B 参数值进行初始化,其中输出层是投影到单个类别用于奖励建模的分类层。
Llama2 7B 模型的实例