快捷方式

format_content_with_images

torchtune.data.format_content_with_images(content: str, *, image_tag: str, images: List[PIL.Image.Image]) List[Dict[str, Any]][源代码]

给定一个原始文本字符串,根据指定的 image_tag 进行分割,并将其格式化为字典列表,以便在 Message 的 content 字段中使用。

[
    {
        "role": "system" | "user" | "assistant",
        "content":
            [
                {"type": "image", "content": <PIL.Image.Image>},
                {"type": "text", "content": "This is a sample image."},
            ],
    },
    ...
]
参数:
  • content (str) – 原始消息文本

  • image_tag (str) – 用于分割文本的字符串

  • images (List["PIL.Image.Image"]) – 要在内容中使用的图像列表

引发:

ValueError – 如果图像数量与内容中的图像标签数量不匹配

示例

>>> content = format_content_with_images(
...     "<|image|>hello <|image|>world",
...     image_tag="<|image|>",
...     images=[<PIL.Image.Image>, <PIL.Image.Image>]
... )
>>> print(content)
[
    {"type": "image", "content": <PIL.Image.Image>},
    {"type": "text", "content": "hello "},
    {"type": "image", "content": <PIL.Image.Image>},
    {"type": "text", "content": "world"}
]
返回值:

要在 Message 的 content 字段中使用的字典列表

返回类型:

List[Dict[str, Any]]

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取针对初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并获得问题的解答

查看资源