RandomIoUCrop¶
- class torchvision.transforms.v2.RandomIoUCrop(min_scale: float = 0.3, max_scale: float = 1.0, min_aspect_ratio: float = 0.5, max_aspect_ratio: float = 2.0, sampler_options: Optional[List[float]] = None, trials: int = 40)[源代码]¶
来自 “SSD:单次多框检测器” 的随机 IoU 裁剪变换。
此变换需要输入图像或视频数据和
tv_tensors.BoundingBoxes
。警告
为了正确删除低于 IoU 阈值的边界框,RandomIoUCrop 必须后跟
SanitizeBoundingBoxes
,可以紧随其后或稍后在变换管道中进行。如果输入是
torch.Tensor
或TVTensor
(例如Image
、Video
、BoundingBoxes
等),它可以具有任意数量的前导批次维度。例如,图像可以具有[..., C, H, W]
形状。边界框可以具有[..., 4]
形状。- 参数:
min_scale (float,可选) – 缩放输入大小的最小因子。
max_scale (float,可选) – 缩放输入大小的最大因子。
min_aspect_ratio (float,可选) – 裁剪后的图像或视频的最小纵横比。
max_aspect_ratio (float,可选) – 裁剪后的图像或视频的最大纵横比。
sampler_options (python:float 列表,可选) – 所有框与裁剪后的图像或视频之间的最小 IoU(Jaccard)重叠列表。默认值为
None
,对应于[0.0, 0.1, 0.3, 0.5, 0.7, 0.9, 1.0]
trials (int,可选) – 为给定最小 IoU(Jaccard)重叠值查找裁剪的尝试次数。默认值为 40。
使用
RandomIoUCrop
的示例Transforms v2:端到端目标检测/分割示例