快捷方式

decode_avif

torchvision.io.decode_avif(input: Tensor, mode: ImageReadMode = ImageReadMode.UNCHANGED) Tensor[源代码]

将 AVIF 图像解码为 3 维 RGB[A] 张量。

警告

为了启用 torchvision 的 AVIF 解码功能,您首先需要运行 pip install torchvision-extra-decoders。只需安装软件包,您无需更新代码。这仅在 Linux 上受支持,并且此功能仍处于 BETA 阶段。如有任何问题,请告知我们:https://github.com/pytorch/vision/issues/new/choose。请注意,torchvision-extra-decoders 是在 LGPL 许可下发布的。

对于大多数图像,输出张量的值在 uint8 [0, 255] 中。如果图像的位深度超过 8,则输出张量为 uint16 [0, 65535]。由于 pytorch 中 uint16 支持有限,我们建议在此函数之后调用 torchvision.transforms.v2.functional.to_dtype() 并使用 scale=True,以将解码后的图像转换为 uint8 或浮点张量。

参数:
  • input (Tensor[1]) – 一个一维连续 uint8 张量,包含 AVIF 图像的原始字节。

  • mode (strImageReadMode) – 将图像转换成的模式,例如“RGB”。默认为“UNCHANGED”。有关可用模式,请参阅 ImageReadMode

返回:

解码后的图像 (Tensor[image_channels, image_height, image_width])

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取针对初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获得问题解答

查看资源