torchvision¶

此库是 PyTorch 项目的一部分。PyTorch 是一个开源机器学习框架。

本文档中描述的功能按发布状态分类

稳定：这些功能将长期维护，并且通常不应存在文档中的重大性能限制或空白。我们还希望保持向后兼容性（尽管可能会发生重大更改，并且会在提前一个版本发布时发出通知）。

Beta：功能标记为 Beta，因为 API 可能会根据用户反馈而更改，因为性能需要提高，或者因为跨运算符的覆盖范围尚未完成。对于 Beta 功能，我们致力于将该功能贯彻到稳定分类。但是，我们不致力于向后兼容性。

原型：这些功能通常不作为二进制发行版（如 PyPI 或 Conda）的一部分提供，有时除运行时标志外，并且处于早期阶段，用于反馈和测试。

torchvision 包含流行的数据集、模型架构和计算机视觉的常见图像转换。

示例和训练参考

torchvision.get_image_backend()[source]¶: 获取用于加载图像的包的名称

torchvision.get_video_backend()[source]¶

返回当前用于解码视频的活动视频后端。

返回:: 视频后端的名称。{‘pyav’, ‘video_reader’} 之一。
返回类型:: str

torchvision.set_image_backend(backend)[source]¶

指定用于加载图像的包。

参数:: backend (string) – 图像后端的名称。{‘PIL’, ‘accimage’} 之一。 accimage 包使用 Intel IPP 库。它通常比 PIL 快，但支持的操作较少。

torchvision.set_video_backend(backend)[源代码]¶

指定用于解码视频的软件包。

参数:: backend (字符串) – 视频后端的名称。{‘pyav’, ‘video_reader’} 之一。 pyav 软件包使用第三方 PyAv 库。它是 FFmpeg 库的 Pythonic 绑定。 video_reader 软件包在 FFMPEG 库之上包含一个本机 C++ 实现，以及 TorchScript 自定义运算符的 Python API。它通常比 pyav 解码得更快，但可能不太健壮。

注意

在最新的 main 中，默认情况下禁用使用 FFMPEG 构建。如果您想使用“video_reader”后端，请从源代码编译 torchvision。

使用 set_video_backend 的示例

视频 API

PyTorch 库

索引¶

索引

torchvision¶

索引¶

文档

教程

资源