RandomIoUCrop¶
- 类 torchvision.transforms.v2.RandomIoUCrop(min_scale: float = 0.3, max_scale: float = 1.0, min_aspect_ratio: float = 0.5, max_aspect_ratio: float = 2.0, sampler_options: Optional[List[float]] = None, trials: int = 40)[源代码]¶
来自 “SSD: Single Shot MultiBox Detector” 的随机 IoU 裁剪变换。
此变换要求输入包含图像或视频数据以及
tv_tensors.BoundingBoxes
。警告
为了正确移除 IoU 阈值以下的边界框,RandomIoUCrop 之后必须紧跟
SanitizeBoundingBoxes
,无论是在其之后立即执行还是在变换管道的后续步骤中执行。如果输入是
torch.Tensor
或TVTensor
(例如Image
、Video
、BoundingBoxes
等),它可以有任意数量的前置批处理维度。例如,图像可以具有[..., C, H, W]
形状。边界框可以具有[..., 4]
形状。- 参数:
min_scale (float, 可选) – 缩放输入尺寸的最小因子。
max_scale (float, 可选) – 缩放输入尺寸的最大因子。
min_aspect_ratio (float, 可选) – 裁剪后的图像或视频的最小纵横比。
max_aspect_ratio (float, 可选) – 裁剪后的图像或视频的最大纵横比。
sampler_options (python:float 的列表, 可选) – 所有边界框与裁剪后的图像或视频之间的最小 IoU (Jaccard) 重叠列表。默认值为
None
,对应于[0.0, 0.1, 0.3, 0.5, 0.7, 0.9, 1.0]
trials (int, 可选) – 为给定最小 IoU (Jaccard) 重叠值寻找裁剪区域的尝试次数。默认值为 40。
使用
RandomIoUCrop
的示例