RandomResizedCrop¶
- class torchvision.transforms.RandomResizedCrop(size, scale=(0.08, 1.0), ratio=(0.75, 1.3333333333333333), interpolation=InterpolationMode.BILINEAR, antialias: Optional[bool] = True)[source]¶
随机裁剪图像的一部分并调整到给定大小。
如果图像是 torch Tensor,则应具有 […, H, W] 形状,其中 … 表示任意数量的前导维度
对原始图像进行裁剪:裁剪区域具有随机面积 (H * W) 和随机纵横比。此裁剪最终调整为给定大小。这通常用于训练 Inception 网络。
- 参数:
size (int 或 sequence) –
裁剪的预期输出大小,对于每个边缘。如果 size 是 int 而不是像 (h, w) 这样的 sequence,则会生成正方形输出大小
(size, size)
。如果提供长度为 1 的 sequence,则将其解释为 (size[0], size[0])。注意
在 torchscript 模式下,不支持将 size 作为单个 int,请使用长度为 1 的 sequence:
[size, ]
。scale (tuple of python:float) – 指定裁剪随机区域的下限和上限,调整大小之前。scale 是相对于原始图像的面积定义的。
ratio (tuple of python:float) – 裁剪随机纵横比的下限和上限,调整大小之前。
interpolation (InterpolationMode) – 期望的插值枚举,由
torchvision.transforms.InterpolationMode
定义。默认为InterpolationMode.BILINEAR
。如果输入是 Tensor,则仅支持InterpolationMode.NEAREST
、InterpolationMode.NEAREST_EXACT
、InterpolationMode.BILINEAR
和InterpolationMode.BICUBIC
。也接受相应的 Pillow 整数常量,例如PIL.Image.BILINEAR
。antialias (bool, optional) –
是否应用抗锯齿。它仅影响具有双线性或双三次模式的 张量,否则将被忽略:在 PIL 图像上,始终在双线性或双三次模式下应用抗锯齿;在其他模式(对于 PIL 图像和张量)下,抗锯齿没有意义,并且此参数将被忽略。可能的值为
True
(默认):将对双线性或双三次模式应用抗锯齿。其他模式不受影响。这可能是您想要使用的。False
:将不对任何模式下的张量应用抗锯齿。PIL 图像在双线性或双三次模式下仍然会进行抗锯齿处理,因为 PIL 不支持无抗锯齿。None
:对于张量,等效于False
,对于 PIL 图像,等效于True
。此值出于历史原因而存在,除非您真的知道自己在做什么,否则您可能不想使用它。
默认值从 v0.17 中的
None
更改为True
,以使 PIL 和 Tensor 后端保持一致。
使用
RandomResizedCrop
的示例