数据集¶
Torchvision 在 torchvision.datasets
模块中提供了许多内置数据集,以及用于构建自定义数据集的实用程序类。
内置数据集¶
所有数据集都是 torch.utils.data.Dataset
的子类,即它们已实现 __getitem__
和 __len__
方法。因此,它们都可以传递给 torch.utils.data.DataLoader
,该方法可以使用 torch.multiprocessing
工作进程并行加载多个样本。例如
imagenet_data = torchvision.datasets.ImageNet('path/to/imagenet_root/')
data_loader = torch.utils.data.DataLoader(imagenet_data,
batch_size=4,
shuffle=True,
num_workers=args.nThreads)
所有数据集的 API 几乎相同。它们都有两个共同的参数:transform
和 target_transform
,用于分别转换输入和目标。您还可以使用提供的 基类 创建自己的数据集。
图像分类¶
|
Caltech 101 数据集。 |
|
Caltech 256 数据集。 |
|
|
|
CIFAR10 数据集。 |
|
CIFAR100 数据集。 |
|
来自 OpenAI 的 Country211 数据集。 |
|
|
|
EMNIST 数据集。 |
|
EuroSAT 数据集的 RGB 版本。 |
|
一个虚假数据集,它返回随机生成的图像,并将它们作为 PIL 图像返回 |
|
Fashion-MNIST 数据集。 |
|
FER2013 数据集。 |
|
FGVC 航空器 数据集。 |
|
Flickr8k 实体 数据集。 |
|
Flickr30k 实体 数据集。 |
|
牛津 102 花卉 数据集。 |
|
|
|
德国交通标志识别基准 (GTSRB) 数据集。 |
|
iNaturalist 数据集。 |
|
ImageNet 2012 分类数据集。 |
|
Imagenette 图像分类数据集。 |
|
Kuzushiji-MNIST 数据集。 |
|
LFW 数据集。 |
|
LSUN 数据集。 |
|
MNIST 数据集。 |
|
Omniglot 数据集。 |
|
|
|
Places365 分类数据集。 |
|
|
|
QMNIST 数据集。 |
|
|
|
SEMEION 数据集。 |
|
SBU 带标题照片 数据集。 |
|
斯坦福汽车数据集 |
|
STL10 数据集。 |
|
|
|
SVHN 数据集。 |
|
USPS 数据集。 |
图像检测或分割¶
|
MS Coco 检测 数据集。 |
|
|
|
Cityscapes 数据集。 |
|
KITTI 数据集。 |
|
|
|
|
|
Pascal VOC 分割数据集。 |
|
Pascal VOC 检测数据集。 |
|
WIDERFace 数据集。 |
光流¶
|
FlyingChairs 用于光流的数据集。 |
|
FlyingThings3D 用于光流的数据集。 |
|
HD1K 用于光流的数据集。 |
|
KITTI 用于光流 (2015) 的数据集。 |
|
Sintel 用于光流的数据集。 |
立体匹配¶
|
在 CREStereo github 仓库 中链接的 Carla 模拟器数据。 |
|
来自 2012 立体评估基准 的 KITTI 数据集。 |
|
来自 2015 立体评估基准 的 KITTI 数据集。 |
|
用于训练 CREStereo 架构的合成数据集。 |
|
FallingThings 数据集。 |
|
用于 Scene Flow 数据集的数据集接口。 |
|
Sintel 立体数据集。 |
|
InStereo2k 数据集。 |
|
ETH3D 低分辨率双视图 数据集。 |
|
来自 Middlebury 数据集 2014 版本 <https://vision.middlebury.edu/stereo/data/scenes2014/> 的公开场景。 |
图像对¶
|
LFW 数据集。 |
|
多视图立体对应 数据集。 |
视频分类¶
|
HMDB51 数据集。 |
|
通用 Kinetics 数据集。 |
|
UCF101 数据集。 |
视频预测¶
|
MovingMNIST 数据集。 |
自定义数据集的基类¶
|
一个通用的数据加载器。 |
|
一个通用的数据加载器,默认情况下,图像以这种方式排列: . |
|
用于创建与 torchvision 兼容的数据集的基类。 |
Transforms v2¶
|
将 |