快捷方式

CocoCaptions

class torchvision.datasets.CocoCaptions(root: Union[str, Path], annFile: str, transform: Optional[Callable] = None, target_transform: Optional[Callable] = None, transforms: Optional[Callable] = None)[源代码]

MS Coco 图说 数据集。

它需要安装 COCO API

参数:
  • root (strpathlib.Path) – 下载图像到的根目录。

  • annFile (字符串) – JSON 标注文件的路径。

  • transform (可调用对象, 可选) – 一个函数/转换,它接收一个 PIL 图像并返回一个转换后的版本。例如,transforms.PILToTensor

  • target_transform (可调用对象, 可选) – 一个函数/转换,它接收目标并对其进行转换。

  • transforms (可调用对象, 可选) – 一个函数/转换,它接收输入样本及其目标作为输入并返回一个转换后的版本。

示例

import torchvision.datasets as dset
import torchvision.transforms as transforms
cap = dset.CocoCaptions(root = 'dir where images are',
                        annFile = 'json annotation file',
                        transform=transforms.PILToTensor())

print('Number of samples: ', len(cap))
img, target = cap[3] # load 4th sample

print("Image Size: ", img.size())
print(target)

输出

Number of samples: 82783
Image Size: (3L, 427L, 640L)
[u'A plane emitting smoke stream flying over a mountain.',
u'A plane darts across a bright blue sky behind a mountain covered in snow',
u'A plane leaves a contrail above the snowy mountain top.',
u'A mountain that has a plane flying overheard in the distance.',
u'A mountain view with a plume of smoke in the background']
特殊成员:

__getitem__(index: int) Tuple[Any, Any]
参数:

index (int) – 索引

返回值:

样本和元数据,可选择由相应的转换进行转换。

返回类型:

(Any)

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取针对初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并获得问题的解答

查看资源