TokenPositionalEmbedding¶
- class torchtune.models.clip.TokenPositionalEmbedding(embed_dim: int, tile_size: int, patch_size: int)[source]¶
图像的 Token 位置嵌入,图像中每个 Token 都不同。
请注意,tile 与 patch(token)不同。有关详细信息,请查看
torchtune.modules.vision_transformer.VisionTransformer
的文档。- 参数: