draw_bounding_boxes¶
- torchvision.utils.draw_bounding_boxes(image: Tensor, boxes: Tensor, labels: Optional[List[str]] = None, colors: Optional[Union[List[Union[str, Tuple[int, int, int]]], str, Tuple[int, int, int]]] = None, fill: Optional[bool] = False, width: int = 1, font: Optional[str] = None, font_size: Optional[int] = None) Tensor [源代码]¶
在给定的 RGB 图像上绘制边界框。图像值应为 uint8 且在 [0, 255] 范围内,或为 float 且在 [0, 1] 范围内。如果 fill 为 True,则生成的张量应保存为 PNG 图像。
- 参数:
image (Tensor) – 形状为 (C, H, W) 且 dtype 为 uint8 或 float 的张量。
boxes (Tensor) – 大小为 (N, 4) 的张量,包含以 (xmin, ymin, xmax, ymax) 格式表示的边界框。请注意,边界框是相对于图像的绝对坐标。换句话说:0 <= xmin < xmax < W 且 0 <= ymin < ymax < H。
labels (List[str]) – 包含边界框标签的列表。
colors (颜色 或 颜色列表, 可选) – 包含框的颜色列表或所有框的单一颜色。颜色可以用 PIL 字符串表示,例如“red”或“#FF00FF”,或者可以用 RGB 元组表示,例如
(240, 10, 157)
。默认情况下,将为框生成随机颜色。fill (bool) – 如果为 True,则使用指定的颜色填充边界框。
width (int) – 边界框的宽度。
font (str) – 包含 TrueType 字体的文件名。如果在此文件名中找不到该文件,加载程序还可能在其他目录中搜索,例如 Windows 上的 fonts/ 目录或 macOS 上的 /Library/Fonts/、/System/Library/Fonts/ 和 ~/Library/Fonts/。
font_size (int) – 请求的字体大小,以磅为单位。
- 返回值:
dtype 为 uint8 且已绘制边界框的图像张量。
- 返回类型:
img (Tensor[C, H, W])
使用
draw_bounding_boxes
的示例将掩码重新用于边界框可视化工具