快捷键

draw_bounding_boxes

torchvision.utils.draw_bounding_boxes(image: Tensor, boxes: Tensor, labels: Optional[List[str]] = None, colors: Optional[Union[List[Union[str, Tuple[int, int, int]]], str, Tuple[int, int, int]]] = None, fill: Optional[bool] = False, width: int = 1, font: Optional[str] = None, font_size: Optional[int] = None) Tensor[源代码]

在给定的 RGB 图像上绘制边界框。图像值应为 uint8 且在 [0, 255] 范围内,或为 float 且在 [0, 1] 范围内。如果 fill 为 True,则生成的张量应保存为 PNG 图像。

参数:
  • image (Tensor) – 形状为 (C, H, W) 且 dtype 为 uint8 或 float 的张量。

  • boxes (Tensor) – 大小为 (N, 4) 的张量,包含以 (xmin, ymin, xmax, ymax) 格式表示的边界框。请注意,边界框是相对于图像的绝对坐标。换句话说:0 <= xmin < xmax < W0 <= ymin < ymax < H

  • labels (List[str]) – 包含边界框标签的列表。

  • colors (颜色颜色列表, 可选) – 包含框的颜色列表或所有框的单一颜色。颜色可以用 PIL 字符串表示,例如“red”或“#FF00FF”,或者可以用 RGB 元组表示,例如 (240, 10, 157)。默认情况下,将为框生成随机颜色。

  • fill (bool) – 如果为 True,则使用指定的颜色填充边界框。

  • width (int) – 边界框的宽度。

  • font (str) – 包含 TrueType 字体的文件名。如果在此文件名中找不到该文件,加载程序还可能在其他目录中搜索,例如 Windows 上的 fonts/ 目录或 macOS 上的 /Library/Fonts//System/Library/Fonts/~/Library/Fonts/

  • font_size (int) – 请求的字体大小,以磅为单位。

返回值:

dtype 为 uint8 且已绘制边界框的图像张量。

返回类型:

img (Tensor[C, H, W])

使用 draw_bounding_boxes 的示例

将掩码重新用于边界框

将掩码重新用于边界框

可视化工具

可视化工具

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取针对初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并获得问题的解答

查看资源