decode_png¶
- torchvision.io.decode_png(input: Tensor, mode: ImageReadMode = ImageReadMode.UNCHANGED, apply_exif_orientation: bool = False) Tensor [源码]¶
将 PNG 图像解码为 3 维 RGB 或灰度 Tensor。
在大多数情况下,输出 tensor 的值范围是 uint8 [0, 255]。如果图像是 16 位 PNG,则输出 tensor 的值范围是 uint16 [0, 65535](从 torchvision
0.21
开始支持)。由于 PyTorch 中对 uint16 的支持有限,我们建议在此函数之后调用torchvision.transforms.v2.functional.to_dtype()
并设置scale=True
,以便将解码后的图像转换为 uint8 或 float tensor。- 参数:
input (Tensor[1]) – 包含 PNG 图像原始字节的一维 uint8 tensor。
mode (str 或 ImageReadMode) – 将图像转换为的模式,例如 “RGB”。默认为 “UNCHANGED”。有关可用模式,请参见
ImageReadMode
。apply_exif_orientation (bool) – 对输出 tensor 应用 EXIF 方向变换。默认为 False。
- 返回:
输出 (Tensor[image_channels, image_height, image_width])