快捷方式

torchvision

此库是 PyTorch 项目的一部分。PyTorch 是一个开源机器学习框架。

本文档中描述的功能按发布状态分类

稳定版: 这些功能将长期维护,并且通常在性能上没有重大限制或文档缺失。我们还希望保持向后兼容性(尽管可能会发生重大更改,并且会提前一个版本发布通知)。

测试版: 功能被标记为测试版,因为 API 可能会根据用户反馈而更改,因为性能需要改进,或者因为运算符的覆盖范围尚不完整。对于测试版功能,我们承诺将其发展到稳定版分类。但是,我们不承诺向后兼容性。

原型: 这些功能通常不作为二进制发行版(如 PyPI 或 Conda)的一部分提供,除非有时在运行时标志后面,并且处于早期阶段以供反馈和测试。

torchvision 包包含流行的数据集、模型架构和用于计算机视觉的常见图像转换。

示例和训练参考

torchvision.get_image_backend()[源代码]

获取用于加载图像的包的名称

torchvision.get_video_backend()[源代码]

返回当前用于解码视频的活动视频后端。

返回值:

视频后端的名称。{‘pyav’, ‘video_reader’} 之一。

返回类型:

str

torchvision.set_image_backend(backend)[源代码]

指定用于加载图像的包。

参数:

backend (字符串) – 图像后端的名称。{‘PIL’, ‘accimage’} 之一。该 accimage 包使用英特尔 IPP 库。它通常比 PIL 快,但不支持那么多操作。

torchvision.set_video_backend(backend)[源代码]

指定用于解码视频的包。

参数:

backend (字符串) – 视频后端的名称。{‘pyav’, ‘video_reader’} 之一。该 pyav 包使用第三方 PyAv 库。它是 FFmpeg 库的 Pythonic 绑定。该 video_reader 包包括 FFMPEG 库之上的原生 C++ 实现,以及 TorchScript 自定义运算符的 Python API。它通常比 pyav 解码速度快,但也可能不那么稳健。

注意

在最新的 main 中,默认情况下禁用使用 FFMPEG 构建。如果要使用“video_reader”后端,请从源代码编译 torchvision。

使用 set_video_backend 的示例

视频 API

视频 API

索引

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取针对初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并获得问题的解答

查看资源