• 文档 >
  • 欢迎来到 TorchCodec 文档!
快捷方式

欢迎来到 TorchCodec 文档!

TorchCodec 是一个 Python 库,用于将视频和音频数据解码为 PyTorch 张量,可在 CPU 和 CUDA GPU 上运行。它旨在快速、易于使用,并与 PyTorch 生态系统良好集成。如果你想使用 PyTorch 在视频和音频上训练 ML 模型,TorchCodec 可以帮助你将这些数据转换出来。

我们通过以下方式实现这些功能:

  • 遵循 Python 和 PyTorch 约定的 Pythonic API。

  • 依靠 FFmpeg 进行解码。TorchCodec 使用你已安装的 FFmpeg 版本。FFmpeg 是一个成熟的库,在大多数系统上都可用且覆盖范围广泛。但是,它并不容易使用。TorchCodec 抽象了 FFmpeg 的复杂性,以确保其被正确有效地使用。

  • 将数据作为 PyTorch 张量返回,可直接馈入 PyTorch 变换或用于训练模型。

TorchCodec 入门

一个简单的视频解码示例

generated_examples/basic_example.html
音频解码

一个简单的音频解码示例

generated_examples/audio_decoding.html
GPU 解码

一个演示 CUDA GPU 解码的简单示例

generated_examples/basic_cuda_example.html
视频流

如何高效地从云端解码视频

generated_examples/file_like.html
剪辑采样

如何从视频中采样规则和随机剪辑

generated_examples/sampling.html

注意

TorchCodec 仍处于开发阶段,我们正在积极寻求反馈。如果您有任何建议或问题,请通过在我们的 GitHub 仓库创建议题来告知我们。

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取针对初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获得问题解答

查看资源