快捷方式

FiveCrop

class torchvision.transforms.v2.FiveCrop(size: Union[int, Sequence[int]])[源代码]

将图像或视频裁剪成四个角和中心裁剪。

如果输入是 torch.TensorImageVideo,它可以具有任意数量的前导批处理维度。例如,图像可以具有 [..., C, H, W] 形状。

注意

此转换返回一个图像元组,并且您的 Dataset 返回的输入和目标数量可能不匹配。请参阅下面的示例,了解如何处理此问题。

参数:

size (序列int) – 裁剪所需的输出大小。如果 size 是 int 而不是序列,例如 (h, w),则进行大小为 (size, size) 的正方形裁剪。如果提供长度为 1 的序列,它将被解释为 (size[0], size[0])。

示例

>>> class BatchMultiCrop(transforms.Transform):
...     def forward(self, sample: Tuple[Tuple[Union[tv_tensors.Image, tv_tensors.Video], ...], int]):
...         images_or_videos, labels = sample
...         batch_size = len(images_or_videos)
...         image_or_video = images_or_videos[0]
...         images_or_videos = tv_tensors.wrap(torch.stack(images_or_videos), like=image_or_video)
...         labels = torch.full((batch_size,), label, device=images_or_videos.device)
...         return images_or_videos, labels
...
>>> image = tv_tensors.Image(torch.rand(3, 256, 256))
>>> label = 3
>>> transform = transforms.Compose([transforms.FiveCrop(224), BatchMultiCrop()])
>>> images, labels = transform(image, label)
>>> images.shape
torch.Size([5, 3, 224, 224])
>>> labels
tensor([3, 3, 3, 3, 3])

使用 FiveCrop 的示例

转换说明

转换说明

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取针对初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并获得问题的解答

查看资源