read_video¶
- torchvision.io.read_video(filename: str, start_pts: Union[float, Fraction] = 0, end_pts: Optional[Union[float, Fraction]] = None, pts_unit: str = 'pts', output_format: str = 'THWC') Tuple[Tensor, Tensor, Dict[str, Any]] [源代码]¶
从文件中读取视频,同时返回视频帧和音频帧
警告
在不久的将来,我们打算将 PyTorch 的视频解码功能集中在 torchcodec 项目中。我们鼓励您尝试并分享您的反馈,因为 torchvision 视频解码器最终将被弃用。
- 参数:
filename (str) – 视频文件的路径。如果使用 pyav 后端,则可以是
av.open
接受的任何内容。start_pts (python:int if pts_unit = 'pts', python:float / Fraction if pts_unit = 'sec', 可选) – 视频的开始显示时间
end_pts (python:int if pts_unit = 'pts', python:float / Fraction if pts_unit = 'sec', 可选) – 结束显示时间
pts_unit (str, 可选) – 解释 start_pts 和 end_pts 值的单位,可以是 'pts' 或 'sec'。默认为 'pts'。
output_format (str, 可选) – 输出视频张量的格式。可以是“THWC”(默认值)或“TCHW”。
- 返回值:
the T 视频帧 aframes (Tensor[K, L]): 音频帧,其中 K 是通道数,L 是点数 info (Dict): 视频和音频的元数据。可以包含字段 video_fps (float) 和 audio_fps (int)
- 返回类型:
vframes (Tensor[T, H, W, C] 或 Tensor[T, C, H, W])
使用
read_video
的示例光流:使用 RAFT 模型预测运动