从源代码构建¶
TorchAudio 集成了 PyTorch 用于数值计算,以及第三方库用于多媒体 I/O。它需要以下工具才能从源代码构建。
大多数工具都可以在 Conda 中找到,因此我们建议使用 Conda。
自定义构建¶
可以通过环境变量启用/禁用 TorchAudio 与第三方库的集成。
可以通过传递 1
来启用,传递 0
来禁用。
BUILD_SOX
:启用/禁用基于 libsox 的 I/O 功能。BUILD_KALDI
:启用/禁用基于 Kaldi 的特征提取。BUILD_RNNT
:启用/禁用自定义 RNN-T 损失函数。USE_FFMPEG
:启用/禁用基于 FFmpeg 库的 I/O 功能。USE_ROCM
:启用/禁用 AMD ROCm 支持。USE_CUDA
:启用/禁用 CUDA 支持。
有关最新配置及其默认值,请查看源代码。 https://github.com/pytorch/audio/blob/main/tools/setup_helpers/extension.py