sanitize_bounding_boxes¶
- torchvision.transforms.v2.functional.sanitize_bounding_boxes(bounding_boxes: Tensor, format: Optional[BoundingBoxFormat] = None, canvas_size: Optional[Tuple[int, int]] = None, min_size: float = 1.0, min_area: float = 1.0) Tuple[Tensor, Tensor] [源码]¶
移除退化/无效的边界框并返回对应的索引掩码。
这将移除以下边界框:
小于给定的
min_size
或min_area
:默认情况下,这也会移除退化框,例如 X2 <= X1 的框。其任何坐标位于对应图像之外。您可能希望先调用
clamp_bounding_boxes()
以避免不必要的移除。
建议在管道结束时调用它,在将输入传递给模型之前。如果调用了
RandomIoUCrop
,则调用此变换至关重要。如果您想额外小心,可以在所有可能修改边界框的变换之后调用它,但在大多数情况下,只需在最后调用一次就足够了。- 参数:
bounding_boxes (Tensor 或
BoundingBoxes
) – 要清理的边界框。format (str 或
BoundingBoxFormat
, optional) – 边界框的格式。如果bounding_boxes
是BoundingBoxes
对象,则必须将其设为 None。canvas_size (tuple of python:int, optional) – 边界框的画布大小(对应图像/视频的大小)。如果
bounding_boxes
是BoundingBoxes
对象,则必须将其设为 None。min_size (float, optional) –
min_area (float, optional) –
- 返回值:
有效的边界框子集,以及对应的索引掩码。该掩码可用于对与边界框相关的其他张量(例如标签)进行子集选择。
- 返回类型:
out (tuple of Tensors)