快捷方式

torchaudio.prototype.models

The torchaudio.prototype.models subpackage contains definitions of models for addressing common audio tasks.

注意

对于具有预训练参数的模型,请参考 torchaudio.prototype.pipelines 模块。

模型定义负责构建计算图并执行它们。

一些模型具有复杂的结构和变体。对于此类模型,提供了工厂函数。

ConformerWav2Vec2PretrainModel

Conformer Wav2Vec2 预训练模型,用于从头开始训练。

ConvEmformer

实现了在 使用非因果卷积的基于流式转换器的转换器语音识别 [Shi et al., 2022] 中介绍的卷积增强流式转换器架构。

HiFiGANVocoder

HiFi GAN [Kong et al., 2020] 的生成器部分。

Beta 模型的原型工厂函数

一些模型定义处于 beta 阶段,但仍有一些新的工厂函数处于原型阶段。请查看每个模型的“原型工厂函数”部分。

Wav2Vec2Model

wav2vec 2.0 [Baevski et al., 2020] 中使用的声学模型。

RNNT

循环神经网络转换器 (RNN-T) 模型。

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取针对初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并获得问题解答

查看资源