torchaudio.prototype.models¶

torchaudio.prototype.models 子包包含用于解决常见音频任务的模型定义。

注意

对于具有预训练参数的模型，请参考 torchaudio.prototype.pipelines 模块。

模型定义负责构建计算图并执行它们。

一些模型具有复杂的结构和变体。对于这些模型，提供了工厂函数。

`ConformerWav2Vec2PretrainModel`	用于从头开始训练的 Conformer Wav2Vec2 预训练模型。
`ConvEmformer`	实现 Streaming Transformer Transducer based Speech Recognition Using Non-Causal Convolution [Shi 等人，2022] 中介绍的卷积增强流式 Transformer 架构。
`HiFiGANVocoder`	HiFi GAN [Kong 等人，2020] 的生成器部分。

Beta 模型的原型工厂函数¶

一些模型定义处于 Beta 版本，但仍有新的工厂函数处于原型阶段。请检查每个模型的“原型工厂函数”部分。

`Wav2Vec2Model`	wav2vec 2.0 [Baevski 等人，2020] 中使用的声学模型。
`RNNT`	循环神经网络转换器 (RNN-T) 模型。