llama3_2_vision_11b¶ torchtune.models.llama3_2_vision.llama3_2_vision_11b(decoder_trainable: bool = False, encoder_trainable: bool = True, fusion_trainable: bool = True, image_size: int = 560) → DeepFusionModel[source]¶ Llama 3.2 Vision 11B 模型 参数: decoder_trainable (bool) – 是否使解码器参数可训练。默认为 False。 encoder_trainable (bool) – 是否使编码器参数可训练。默认为 True。 fusion_trainable (bool) – 是否使融合参数可训练。默认为 True。 image_size (int) – 图像将被平铺和调整大小的基础图像尺寸。Instruct 权重的默认值为 560,预训练权重的默认值为 448。 返回: Llama 3.2 Vision 11B 模型的实例化 返回类型: DeepFusionModel