快捷方式

Flickr8k

class torchvision.datasets.Flickr8k(root: ~typing.Union[str, ~pathlib.Path], ann_file: str, transform: ~typing.Optional[~typing.Callable] = None, target_transform: ~typing.Optional[~typing.Callable] = None, loader: ~typing.Callable[[str], ~typing.Any] = <function default_loader>)[source]

Flickr8k Entities 数据集。

参数:
  • root (str 或 pathlib.Path) – 下载图像的根目录。

  • ann_file (string) – 注解文件的路径。

  • transform (callable, optional) – 一个函数/变换,根据给定的加载器接收 PIL 图像或 torch.Tensor,并返回变换后的版本。例如,transforms.RandomCrop

  • target_transform (callable, optional) – 一个函数/变换,接收目标并对其进行变换。

  • loader (callable, optional) – 一个根据路径加载图像的函数。默认情况下,它使用 PIL 作为图像加载器,但用户也可以传入 torchvision.io.decode_image 以直接将图像数据解码为张量。

特殊成员:

__getitem__(index: int) Tuple[Any, Any][source]
参数:

index (int) – 索引

返回:

元组 (image, target)。target 是图像的标注列表。

返回类型:

tuple

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取针对初学者和高级开发者的深度教程

查看教程

资源

查找开发资源并获得问题解答

查看资源