快捷方式

torchaudio.prototype.models

torchaudio.prototype.models 子包包含用于处理常见音频任务的模型定义。

注意

对于带有预训练参数的模型,请参考 torchaudio.prototype.pipelines 模块。

模型定义负责构建计算图并执行它们。

有些模型结构复杂且有变体。对于此类模型,提供了工厂函数。

ConformerWav2Vec2PretrainModel

用于从头开始训练的 Conformer Wav2Vec2 预训练模型。

ConvEmformer

实现了在《使用非因果卷积的流式 Transformer Transducer 语音识别》中介绍的卷积增强流式 Transformer 架构 [Shi et al., 2022]

HiFiGANVocoder

HiFi GAN 的生成器部分 [Kong et al., 2020]

Beta 模型的原型工厂函数

有些模型定义处于 Beta 阶段,但有一些新的工厂函数仍处于原型阶段。请查阅每个模型的“原型工厂函数”部分。

Wav2Vec2Model

wav2vec 2.0 中使用的声学模型 [Baevski et al., 2020]

RNNT

循环神经网络 transducer (RNN-T) 模型。

文档

访问 PyTorch 的完整开发者文档

查看文档

教程

获取面向初学者和高级开发者的深度教程

查看教程

资源

查找开发资源并获得问题解答

查看资源