mistral_reward_7b¶
- torchtune.models.mistral.mistral_reward_7b() TransformerDecoder [source]¶
用于创建 Mistral 7B 模型的构建器,该模型使用来自以下位置的默认 7b 参数值进行初始化: https://hugging-face.cn/Ray2333/reward-model-Mistral-7B-instruct-Unified-Feedback 其中输出层是分类层,投影到单个类别以进行奖励建模。
- 返回:
Mistral 7B 分类器模型的实例化
- 返回类型: