快捷方式

torchvision

该库是 PyTorch 项目的一部分。PyTorch 是一个开源机器学习框架。

本文档中描述的功能按发布状态分类

Stable (稳定): 这些功能将长期维护,通常不会有主要的性能限制或文档空白。我们也期望保持向后兼容性(尽管可能发生破坏性变更,但会提前一个版本发出通知)。

Beta (测试版): 功能被标记为 Beta 版,是因为其 API 可能根据用户反馈而变化,性能需要改进,或者对算子的覆盖尚未完全。对于 Beta 功能,我们致力于将其推进到 Stable 分类。但我们不承诺向后兼容性。

Prototype (原型): 这些功能通常不作为 PyPI 或 Conda 等二进制发行版的一部分提供,除非有时通过运行时标志启用,并且处于早期阶段,用于收集反馈和进行测试。

torchvision 包包含流行的计算机视觉数据集、模型架构和常用图像转换。

示例和训练参考

torchvision.get_image_backend()[source]

获取用于加载图像的包的名称

torchvision.get_video_backend()[source]

返回当前用于解码视频的活动视频后端。

返回:

视频后端名称。{'pyav', 'video_reader'} 之一。

返回类型:

str

torchvision.set_image_backend(backend)[source]

指定用于加载图像的包。

参数:

backend (string) – 图像后端名称。{'PIL', 'accimage'} 之一。accimage 包使用 Intel IPP 库。它通常比 PIL 快,但不支持那么多操作。

torchvision.set_video_backend(backend)[source]

指定用于解码视频的包。

参数:

backend (string) – 视频后端名称。{'pyav', 'video_reader'} 之一。pyav 包使用第三方 PyAv 库。它是 FFmpeg 库的 Python 绑定。video_reader 包包含基于 FFMPEG 库的本地 C++ 实现以及 TorchScript 自定义算子的 python API。它通常比 pyav 解码速度更快,但可能不够稳定。

注意

在最新的 main 分支中,默认禁用使用 FFMPEG 构建。如果您想使用 'video_reader' 后端,请从源代码编译 torchvision。

索引¶

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

获取面向初学者和高级开发者的深度教程

查看教程

资源

查找开发资源并获取问题解答

查看资源