llama2_reward_7b¶

torchtune.models.llama2.llama2_reward_7b() → TransformerDecoder[source]¶

用于创建一个 Llama2 模型，该模型使用来自 https://arxiv.org/abs/2307.09288 的默认 7B 参数值进行初始化，其中输出层是投影到单个类别用于奖励建模的分类层。

文档