llama3_2_vision_11b¶ torchtune.models.llama3_2_vision.llama3_2_vision_11b(decoder_trainable: bool = False, encoder_trainable: bool = True, fusion_trainable: bool = True, image_size: int = 560) → DeepFusionModel[源代码]¶ Llama 3.2 Vision 11B 模型 参数: decoder_trainable (bool) – 是否使解码器参数可训练。默认值为 False。 encoder_trainable (bool) – 是否使编码器参数可训练。默认值为 True。 fusion_trainable (bool) – 是否使融合参数可训练。默认值为 True。 image_size (int) – 图像将被平铺和调整大小的基图像大小。对于指令权重,默认值为 560,对于预训练权重,使用 448。 返回: Llama 3.2 Vision 11B 模型的实例化 返回类型: DeepFusionModel