mistral_reward_7b¶
- torchtune.models.mistral.mistral_reward_7b() TransformerDecoder [source]¶
用于创建 Mistral 7B 模型的构建器,该模型使用来自以下地址的默认 7B 参数值初始化:https://hugging-face.cn/Ray2333/reward-model-Mistral-7B-instruct-Unified-Feedback,其中输出层是投影到单个类的分类层,用于奖励建模。
- 返回值:
Mistral 7B 分类模型的实例
- 返回类型: