快捷方式

RandomResize

class torchvision.transforms.v2.RandomResize(min_size: int, max_size: int, interpolation: Union[InterpolationMode, int] = InterpolationMode.BILINEAR, antialias: Optional[bool] = True)[source]

随机调整输入大小。

此变换可以与 RandomCrop 一起用作数据增强,以训练图像分割任务的模型。

输出空间大小从区间 [min_size, max_size] 随机采样

size = uniform_sample(min_size, max_size)
output_width = size
output_height = size

如果输入是 torch.TensorTVTensor (例如 Image, Video, BoundingBoxes 等),它可以具有任意数量的前导批次维度。例如,图像可以具有 [..., C, H, W] 形状。 bounding box 可以具有 [..., 4] 形状。

参数:
  • min_size (int) – 随机采样的最小输出大小

  • max_size (int) – 随机采样的最大输出大小

  • interpolation (InterpolationMode, optional) – 由 torchvision.transforms.InterpolationMode 定义的所需插值枚举。 默认值为 InterpolationMode.BILINEAR。 如果输入是 Tensor,则仅支持 InterpolationMode.NEARESTInterpolationMode.NEAREST_EXACTInterpolationMode.BILINEARInterpolationMode.BICUBIC。 相应的 Pillow 整数常量,例如 PIL.Image.BILINEAR 也被接受。

  • antialias (bool, optional) –

    是否应用抗锯齿。 它仅影响具有双线性或双三次模式的 张量,否则将被忽略:在 PIL 图像上,始终在双线性或双三次模式下应用抗锯齿;在其他模式下(对于 PIL 图像和张量),抗锯齿没有意义,并且此参数将被忽略。 可能的值是

    • True (默认值):将为双线性或双三次模式应用抗锯齿。 其他模式不受影响。 这可能是您想要使用的。

    • False: 将不会对任何模式下的张量应用抗锯齿。 PIL 图像仍然在双线性或双三次模式下进行抗锯齿处理,因为 PIL 不支持无抗锯齿。

    • None: 对于张量等效于 False,对于 PIL 图像等效于 True。 此值是出于遗留原因而存在的,除非您真的知道自己在做什么,否则您可能不想使用它。

    默认值在 v0.17 中从 None 更改为 True,以使 PIL 和 Tensor 后端保持一致。

make_params(flat_inputs: List[Any]) Dict[str, Any][source]

用于覆盖自定义变换的方法。

请参阅 如何编写自己的 v2 变换

transform(inpt: Any, params: Dict[str, Any]) Any[source]

用于覆盖自定义变换的方法。

请参阅 如何编写自己的 v2 变换


© 版权所有 2017-至今,Torch 贡献者。

使用 Sphinx 构建,主题由 Read the Docs 提供。

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取面向初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获得问题解答

查看资源