快捷方式

sanitize_bounding_boxes

torchvision.transforms.v2.functional.sanitize_bounding_boxes(bounding_boxes: Tensor, format: Optional[BoundingBoxFormat] = None, canvas_size: Optional[Tuple[int, int]] = None, min_size: float = 1.0, min_area: float = 1.0) Tuple[Tensor, Tensor][source]

移除退化/无效边界框,并返回相应的索引掩码。

这将移除以下边界框:

  • 低于给定的 min_sizemin_area:默认情况下,这也会移除具有例如 X2 <= X1 的退化框。

  • 任何坐标位于其对应图像之外。您可能希望先调用 clamp_bounding_boxes() 以避免不必要的移除。

建议在管道末尾调用它,然后将输入传递给模型。如果调用了 RandomIoUCrop,则调用此变换至关重要。如果您要格外小心,您可以在所有可能修改边界框的变换之后调用它,但大多数情况下,在最后调用一次就足够了。

参数::
  • bounding_boxes (Tensor 或 BoundingBoxes) – 要清理的边界框。

  • format (str 或 BoundingBoxFormat,可选) – 边界框的格式。如果 bounding_boxesBoundingBoxes 对象,则必须保留为 None。

  • canvas_size (python:int 的元组, 可选) – 边界框的画布大小(对应图像/视频的大小)。如果 bounding_boxesBoundingBoxes 对象,则必须保留为 None。

  • min_size (float, 可选) –

  • min_area (float, 可选) –

返回值:

有效边界框的子集及其相应的索引掩码。然后可以使用该掩码来对与边界框关联的其他张量(例如标签)进行子集。

返回类型:

out (张量元组)

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取针对初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并获得问题的解答

查看资源