VisionDataset¶
- class torchvision.datasets.VisionDataset(root: Optional[Union[str, Path]] = None, transforms: Optional[Callable] = None, transform: Optional[Callable] = None, target_transform: Optional[Callable] = None)[source]¶
用于创建与 torchvision 兼容的数据集的基类。必须重写
__getitem__
和__len__
方法。- 参数:
root (字符串, 可选) – 数据集的根目录。仅用于 __repr__。
transforms (可调用对象, 可选) – 一个函数/转换,它接收图像和标签,并返回两者转换后的版本。
transform (可调用对象, 可选) – 一个函数/转换,它接收 PIL 图像并返回转换后的版本。例如,
transforms.RandomCrop
target_transform (可调用对象, 可选) – 一个函数/转换,它接收目标并对其进行转换。
注意
transforms
和transform
与target_transform
的组合是互斥的。使用
VisionDataset
的示例Transforms v2:端到端目标检测/分割示例如何使用 CutMix 和 MixUp