mistral_reward_7b¶
- torchtune.models.mistral.mistral_reward_7b() TransformerDecoder [源代码]¶
用于构建 Mistral 7B 模型的构建器,该模型使用默认的 7b 参数值初始化,参数值来自:https://hugging-face.cn/Ray2333/reward-model-Mistral-7B-instruct-Unified-Feedback 其中输出层是一个分类层,投影到一个类别用于奖励建模。
- 返回:
Mistral 7B 分类模型的实例
- 返回类型: