torchaudio.prototype.pipelines¶

pipelines 子包包含具有预训练权重和相关实用程序的模型的 API。

RNN-T 流式/非流式 ASR¶

`EMFORMER_RNNT_BASE_MUSTC`	基于 Emformer-RNNT 的预训练 ASR 管道，能够执行流式和非流式推理。
`EMFORMER_RNNT_BASE_TEDLIUM3`	基于 Emformer-RNNT 的预训练 ASR 管道，能够执行流式和非流式推理。

HiFiGANVocoderBundle 定义了能够将梅尔谱图转换为波形的 HiFiGAN 声码器管道。

数据类，捆绑使用预训练的 HiFiGANVocoder 的相关信息。

HiFiGAN 声码器管道，在 LJ Speech 数据集 [Ito and Johnson, 2017] 上训练。

`VGGishBundle`	VGGish [Hershey et al., 2017] 推理管道，从 torchvggish 和 tensorflow-models 移植而来。
`VGGishBundle.VGGish`	VGGish 模型的实现 [Hershey et al., 2017].
`VGGishBundle.VGGishInputProcessor`	将原始波形转换为示例批次，用作 VGGish 的输入。

预训练的 VGGish [Hershey et al., 2017] 推理管道，从 torchvggish 和 tensorflow-models 移植而来。