安装预构建的二进制文件¶

torchaudio 提供了适用于 PyPI (pip) 和 Anaconda (conda) 的二进制分发包。

详情请参考 https://pytorch.ac.cn/get-started/locally/。

注意

每个 torchaudio 包都是针对特定版本的 torch 编译的。请参考下表并安装正确匹配的 torch 和 torchaudio 版本。

注意

从 0.10 版本开始，torchaudio 提供了仅支持 CPU 和启用 CUDA 的二进制分发包，它们分别需要相应的 PyTorch 分发包。

注意

此软件是针对未修改的 FFmpeg 副本编译的，并已移除特定的 rpath，以便能够使用系统库。LGPL 源代码可从以下位置下载：n4.1.8 (许可证), n5.0.3 (许可证) 和 n6.0 (许可证)。

依赖项¶

PyTorch

支持的 PyTorch 版本请参考下面的兼容性矩阵。

可选依赖项¶

FFmpeg

使用 torchaudio.io 模块和 I/O 函数中的 backend="ffmpeg" 时需要。

从 2.1 版本开始，TorchAudio 官方二进制分发包兼容 FFmpeg 6、5 和 4 版本（>=4.4, <7）。运行时，TorchAudio 首先查找 FFmpeg 6，如果未找到，则继续查找 5，然后是 4。

有多种方法可以安装 FFmpeg 库。请参考官方文档了解如何安装 FFmpeg。如果您使用的是 Anaconda Python 发行版，运行 conda install -c conda-forge 'ffmpeg<7' 将安装兼容的 FFmpeg 库。

如果您需要指定 TorchAudio 查找和链接的 FFmpeg 版本，可以通过环境变量 TORIO_USE_FFMPEG_VERSION 来指定。例如，通过设置 TORIO_USE_FFMPEG_VERSION=5，TorchAudio 将仅查找 FFmpeg 5。

如果由于某些原因此查找机制导致问题，您可以通过设置环境变量 TORIO_USE_FFMPEG=0 来完全禁用 FFmpeg 集成。

有多种方法可以安装 FFmpeg 库。如果您使用的是 Anaconda Python 发行版，运行 conda install -c conda-forge 'ffmpeg<7' 将安装兼容的 FFmpeg 库。

注意

在搜索 FFmpeg 安装时，TorchAudio 查找带有版本号的库文件。即 Linux 上的 libavutil.so.<VERSION>，macOS 上的 libavutil.<VERSION>.dylib，以及 Windows 上的 avutil-<VERSION>.dll。许多公开的预构建二进制文件都遵循这种命名方案，但有些分发版的文件名没有版本号。如果您在检测 FFmpeg 时遇到困难，请仔细检查您安装的库文件是否遵循此命名方案（并确保它们位于库搜索路径中列出的目录之一中）。
SoX

在 I/O 函数中使用 backend="sox" 时需要。

从 2.1 版本开始，TorchAudio 需要单独安装 libsox。

如果动态链接导致问题，您可以设置环境变量 TORCHAUDIO_USE_SOX=0，TorchAudio 将不会使用 SoX。

注意

TorchAudio 查找没有版本号的库文件，即 Linux 上的 libsox.so 和 macOS 上的 libsox.dylib。有些包管理器安装的库文件名不同。例如，Ubuntu 上的 aptitude 会安装 libsox.so.3。要让 TorchAudio 链接到它，您可以创建一个指向它的符号链接，名称为 libsox.so（并将符号链接放在库搜索路径中）。

注意

TorchAudio 在 libsox 14.4.2 上进行了测试。（其他版本可能无法工作。）
SoundFile

在 I/O 函数中使用 backend="soundfile" 时需要。
sentencepiece

使用 Emformer RNN-T 执行自动语音识别时需要。您可以通过运行 pip install sentencepiece 来安装它。
deep-phonemizer

使用 Tacotron2 Text-To-Speech 执行文本转语音时需要。
kaldi_io

使用 torchaudio.kaldi_io 模块时需要。

兼容性矩阵¶

TorchAudio 的官方二进制分发包包含用 C++ 编写并链接到特定版本 PyTorch 的扩展模块。

来自不同版本的 TorchAudio 和 PyTorch 不能一起使用。请参考下表查找匹配的版本。

`PyTorch`	`TorchAudio`	`Python`
`2.1.0`	`2.1.0`	`>=3.8`, `<=3.11`
`2.0.1`	`2.0.2`	`>=3.8`, `<=3.11`
`2.0.0`	`2.0.1`	`>=3.8`, `<=3.11`
`1.13.1`	`0.13.1`	`>=3.7`, `<=3.10`
`1.13.0`	`0.13.0`	`>=3.7`, `<=3.10`
`1.12.1`	`0.12.1`	`>=3.7`, `<=3.10`
`1.12.0`	`0.12.0`	`>=3.7`, `<=3.10`
`1.11.0`	`0.11.0`	`>=3.7`, `<=3.9`
`1.10.0`	`0.10.0`	`>=3.6`, `<=3.9`
`1.9.1`	`0.9.1`	`>=3.6`, `<=3.9`
`1.8.1`	`0.8.1`	`>=3.6`, `<=3.9`
`1.7.1`	`0.7.2`	`>=3.6`, `<=3.9`
`1.7.0`	`0.7.0`	`>=3.6`, `<=3.8`
`1.6.0`	`0.6.0`	`>=3.6`, `<=3.8`
`1.5.0`	`0.5.0`	`>=3.5`, `<=3.8`
`1.4.0`	`0.4.0`	`==2.7`, `>=3.5`, `<=3.8`

安装预构建的二进制文件¶

依赖项¶

可选依赖项¶

兼容性矩阵¶

文档

教程

资源