RandomShortestSize¶
- class torchvision.transforms.v2.RandomShortestSize(min_size: Union[List[int], Tuple[int], int], max_size: Optional[int] = None, interpolation: Union[InterpolationMode, int] = InterpolationMode.BILINEAR, antialias: Optional[bool] = True)[源代码]¶
随机调整输入的大小。
如果输入是
torch.Tensor
或TVTensor
(例如Image
、Video
、BoundingBoxes
等),它可以具有任意数量的前导批次维度。例如,图像可以具有[..., C, H, W]
形状。边界框可以具有[..., 4]
形状。- 参数:
min_size (int 或 python:int 的序列) – 最小空间大小。单个整数值或一系列整数值。
max_size (int,可选) – 最大空间大小。默认值,None。
interpolation (InterpolationMode,可选) – 由
torchvision.transforms.InterpolationMode
定义的所需插值枚举。默认为InterpolationMode.BILINEAR
。如果输入是张量,则仅支持InterpolationMode.NEAREST
、InterpolationMode.NEAREST_EXACT
、InterpolationMode.BILINEAR
和InterpolationMode.BICUBIC
。相应的 Pillow 整数常量(例如PIL.Image.BILINEAR
)也被接受。antialias (bool,可选) –
是否应用抗锯齿。它仅影响具有双线性或双三次模式的张量,否则将被忽略:在 PIL 图像上,始终在双线性或双三次模式上应用抗锯齿;在其他模式(对于 PIL 图像和张量)上,抗锯齿毫无意义,并且此参数将被忽略。可能的值为
True
(默认值):将为双线性或双三次模式应用抗锯齿。其他模式不受影响。这可能是您想要使用的。False
:不会为任何模式下的张量应用抗锯齿。PIL 图像在双线性或双三次模式下仍然具有抗锯齿,因为 PIL 不支持无抗锯齿。None
:对于张量等效于False
,对于 PIL 图像等效于True
。此值出于遗留原因存在,除非您真正知道自己在做什么,否则您可能不想使用它。
默认值在 v0.17 中从
None
更改为True
,以使 PIL 和 Tensor 后端保持一致。