目录

快捷方式

从源代码构建¶

TorchAudio 集成了 PyTorch 用于数值计算以及第三方库用于多媒体 I/O。从源代码构建需要以下工具。

PyTorch
CMake
Ninja
支持 C++ 17 的 C++ 编译器
- GCC (Linux)
- Clang (macOS)
- MSVC 2019 或更新版本 (Windows)
CUDA 工具包和 cuDNN（如果构建 CUDA 扩展）

大多数工具都可以在 Conda 中获取，因此我们建议使用 conda。

定制构建¶

TorchAudio 与第三方库的集成可以通过环境变量启用/禁用。

通过传递 1 启用，通过 0 禁用。

BUILD_SOX: 启用/禁用基于 libsox 的 I/O 功能。
BUILD_KALDI: 启用/禁用基于 Kaldi 的特征提取。
BUILD_RNNT: 启用/禁用自定义 RNN-T 损失函数。
USE_FFMPEG: 启用/禁用基于 FFmpeg 库的 I/O 功能。
USE_ROCM: 启用/禁用 AMD ROCm 支持。
USE_CUDA: 启用/禁用 CUDA 支持。

有关最新配置及其默认值，请查看源代码。 https://github.com/pytorch/audio/blob/main/tools/setup_helpers/extension.py

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取针对初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获得问题解答

查看资源