快捷方式

RandomResizedCrop

class torchvision.transforms.v2.RandomResizedCrop(size: Union[int, Sequence[int]], scale: Tuple[float, float] = (0.08, 1.0), ratio: Tuple[float, float] = (0.75, 1.3333333333333333), interpolation: Union[InterpolationMode, int] = InterpolationMode.BILINEAR, antialias: Optional[bool] = True)[source]

裁剪输入图像的随机部分并将其调整为给定大小。

如果输入是 torch.TensorTVTensor (例如 Image, Video, BoundingBoxes 等),它可以具有任意数量的前导批次维度。例如,图像可以具有 [..., C, H, W] 形状。边界框可以具有 [..., 4] 形状。

对原始输入进行裁剪:裁剪区域具有随机面积 (H * W) 和随机宽高比。最终将裁剪后的图像调整为给定大小。这通常用于训练 Inception 网络。

参数:
  • size (intsequence) –

    裁剪后的预期输出大小,用于每个边缘。如果 size 是 int 而不是像 (h, w) 这样的序列,则会生成正方形输出大小 (size, size)。如果提供长度为 1 的序列,则将其解释为 (size[0], size[0])。

    注意

    在 torchscript 模式下,不支持单个 int 类型的 size,请使用长度为 1 的序列:[size, ]

  • scale (tuple of python:float, optional) – 指定裁剪区域随机面积的下限和上限,在调整大小之前。比例是相对于原始图像面积定义的。

  • ratio (tuple of python:float, optional) – 裁剪区域随机宽高比的下限和上限,在调整大小之前。

  • interpolation (InterpolationMode, optional) – 期望的插值枚举,由 torchvision.transforms.InterpolationMode 定义。默认为 InterpolationMode.BILINEAR。如果输入是 Tensor,则仅支持 InterpolationMode.NEARESTInterpolationMode.NEAREST_EXACTInterpolationMode.BILINEARInterpolationMode.BICUBIC。也接受相应的 Pillow 整数常量,例如 PIL.Image.BILINEAR

  • antialias (bool, optional) –

    是否应用抗锯齿。它仅影响具有双线性或双三次模式的张量,否则将被忽略:在 PIL 图像上,双线性或双三次模式始终应用抗锯齿;在其他模式下(对于 PIL 图像和张量),抗锯齿没有意义,此参数将被忽略。可能的值为

    • True (默认):将为双线性或双三次模式应用抗锯齿。其他模式不受影响。这可能是您想要使用的。

    • False:不会为任何模式下的张量应用抗锯齿。PIL 图像在双线性或双三次模式下仍然会进行抗锯齿处理,因为 PIL 不支持无抗锯齿。

    • None:对于张量等同于 False,对于 PIL 图像等同于 True。此值出于遗留原因而存在,除非您真的知道自己在做什么,否则可能不想使用它。

    为了使 PIL 和 Tensor 后端保持一致,默认值已从 v0.17 中的 None 更改为 True

使用 RandomResizedCrop 的示例

transforms v2 入门

transforms v2 入门

transforms 插图

transforms 插图

如何使用 CutMix 和 MixUp

如何使用 CutMix 和 MixUp

如何编写自己的 v2 transforms

如何编写自己的 v2 transforms
static get_params(img: Tensor, scale: List[float], ratio: List[float]) Tuple[int, int, int, int][source]

获取随机大小裁剪的 crop 参数。

参数:
  • img (PIL ImageTensor) – 输入图像。

  • scale (list) – 裁剪的原始大小范围

  • ratio (list) – 裁剪的原始宽高比范围

返回:

params (i, j, h, w) 将传递给 crop 以进行随机大小裁剪。

返回类型:

tuple

make_params(flat_inputs: List[Any]) Dict[str, Any][source]

用于自定义转换的方法,可以重写。

请参阅 如何编写自己的 v2 transforms

transform(inpt: Any, params: Dict[str, Any]) Any[source]

用于自定义转换的方法,可以重写。

请参阅 如何编写自己的 v2 transforms

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取面向初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获得您的问题解答

查看资源