read_video¶

torchvision.io.read_video(filename: str, start_pts: Union[float, Fraction] = 0, end_pts: Optional[Union[float, Fraction]] = None, pts_unit: str = 'pts', output_format: str = 'THWC') → Tuple[Tensor, Tensor, Dict[str, Any]][source]¶

[已弃用] 从文件中读取视频，返回视频帧和音频帧

警告

已弃用：自 0.22 版本起，torchvision 的所有视频解码和编码功能都已弃用，并将在 0.24 版本中移除。我们建议您迁移到 TorchCodec，未来 PyTorch 的解码/编码功能将整合到那里。

参数：

filename (str) – 视频文件的路径。如果使用 pyav 后端，此参数可以是 av.open 接受的任何值。
start_pts (如果 pts_unit = 'pts'，则为 python:int；如果 pts_unit = 'sec'，则为 python:float / Fraction，可选) – 视频的起始演示时间
end_pts (如果 pts_unit = 'pts'，则为 python:int；如果 pts_unit = 'sec'，则为 python:float / Fraction，可选) – 结束演示时间
pts_unit (str, 可选) – start_pts 和 end_pts 值将被解释的单位，可以是 ‘pts’ 或 ‘sec’。默认为 ‘pts’。
output_format (str, 可选) – 输出视频张量的格式。可以是 “THWC”（默认）或 “TCHW”。

返回：

vframes (Tensor[T, H, W, C] 或 Tensor[T, C, H, W])：T 个视频帧 aframes (Tensor[K, L])：音频帧，其中 K 是通道数，L 是点数 info (Dict)：视频和音频的元数据。可以包含 video_fps (float) 和 audio_fps (int) 字段。

返回类型：

vframes (Tensor[T, H, W, C] 或 Tensor[T, C, H, W])

使用 read_video 的示例

光流：使用 RAFT 模型预测运动

read_video¶

文档

教程

资源