CutMix¶
- class torchvision.transforms.v2.CutMix(*, alpha: float = 1.0, num_classes: Optional[int] = None, labels_getter='default')[source]¶
将 CutMix 应用于提供的图像和标签批次。
论文: CutMix:使用可定位特征训练强大分类器的正则化策略。
注意
此转换旨在用于样本批次,而不是单个图像。 查看 如何使用 CutMix 和 MixUp 查看详细的使用示例。 样本配对是确定性的,通过匹配批次中连续的样本来完成,因此批次需要被打乱(这是一个实现细节,不是保证的惯例)。
在输入中,标签预计是形状为
(batch_size,)
的张量。 它们将被转换为形状为(batch_size, num_classes)
的张量。- 参数:
alpha (float, optional) – 用于 mixup 的 Beta 分布的超参数。 默认为 1。
num_classes (int, optional) – 批次中的类别数量。 用于 one-hot 编码。 只有当标签已经是 one-hot 编码时才能为 None。
labels_getter (callable 或 "default", optional) – 指示如何识别输入中的标签。 默认情况下,如果第二个参数是张量,则将其作为标签。 这涵盖了最常见的场景,即此转换被调用为
CutMix()(imgs_batch, labels_batch)
。 它也可以是一个可调用对象,它接受与转换相同的输入,并返回标签。
使用
CutMix
的示例