欢迎来到 TorchCodec 文档!¶
TorchCodec 是一个 Python 库,用于将视频和音频数据解码为 PyTorch 张量,可在 CPU 和 CUDA GPU 上运行。它旨在快速、易于使用,并与 PyTorch 生态系统良好集成。如果你想使用 PyTorch 在视频和音频上训练 ML 模型,TorchCodec 可以帮助你将这些数据转换出来。
我们通过以下方式实现这些功能:
遵循 Python 和 PyTorch 约定的 Pythonic API。
依靠 FFmpeg 进行解码。TorchCodec 使用你已安装的 FFmpeg 版本。FFmpeg 是一个成熟的库,在大多数系统上都可用且覆盖范围广泛。但是,它并不容易使用。TorchCodec 抽象了 FFmpeg 的复杂性,以确保其被正确有效地使用。
将数据作为 PyTorch 张量返回,可直接馈入 PyTorch 变换或用于训练模型。
如何安装 TorchCodec
一个简单的视频解码示例
一个简单的音频解码示例
一个演示 CUDA GPU 解码的简单示例
如何高效地从云端解码视频
如何从视频中采样规则和随机剪辑