torchvision¶
此库是 PyTorch 项目的一部分。PyTorch 是一个开源机器学习框架。
本文档中描述的功能按发布状态分类
稳定版: 这些功能将长期维护,并且通常不应存在重大的性能限制或文档缺陷。我们也期望保持向后兼容性(尽管可能会发生重大更改,但会提前一个版本给出通知)。
Beta 版: 功能被标记为 Beta 版,因为 API 可能会根据用户反馈而更改,或者因为性能需要改进,或者因为运算符的覆盖范围尚未完成。对于 Beta 版功能,我们承诺将该功能推进到稳定版。但是,我们不承诺向后兼容性。
原型版: 这些功能通常不作为 PyPI 或 Conda 等二进制发行版的一部分提供,除非有时在运行时标志之后,并且处于早期阶段,用于反馈和测试。
torchvision
包包含流行的用于计算机视觉的数据集、模型架构和常用图像转换。
- torchvision.get_video_backend()[source]¶
返回当前用于解码视频的活动视频后端。
- 返回:
视频后端的名称。为 {‘pyav’, ‘video_reader’} 之一。
- 返回类型:
- torchvision.set_image_backend(backend)[source]¶
指定用于加载图像的包。
- 参数:
backend (string) – 图像后端的名称。为 {‘PIL’, ‘accimage’} 之一。accimage 包使用 Intel IPP 库。它通常比 PIL 快,但不支持那么多操作。
- torchvision.set_video_backend(backend)[source]¶
指定用于解码视频的包。
- 参数:
backend (string) – 视频后端的名称。为 {‘pyav’, ‘video_reader’} 之一。pyav 包使用第三方 PyAv 库。它是 FFmpeg 库的 Pythonic 绑定。video_reader 包包含基于 FFMPEG 库的本机 C++ 实现,以及 TorchScript 自定义运算符的 Python API。它通常比 pyav 解码速度更快,但可能不太稳定。
注意
在最新的 main 分支中,默认禁用使用 FFMPEG 构建。如果您想使用 ‘video_reader’ 后端,请从源代码编译 torchvision。
使用
set_video_backend
的示例