TokenPositionalEmbedding¶
- class torchtune.models.clip.TokenPositionalEmbedding(embed_dim: int, tile_size: int, patch_size: int)[source]¶
用于图像的 Token 位置嵌入,图像中的每个 Token 都有不同的嵌入。
请注意,tile 与 patch (token) 不同。详情请查阅
torchtune.modules.vision_transformer.VisionTransformer
的文档。- 参数: