快捷方式

torchaudio.prototype.models.conformer_wav2vec2_base

torchaudio.prototype.models.conformer_wav2vec2_base(extractor_input_dim: int = 64, extractor_output_dim: int = 256, encoder_projection_dropout: float = 0.0) Wav2Vec2Model[源代码]

使用来自 基于 Conformer 的非语音音频任务自监督学习 [Srivastava 等人,2022] 的“small”架构构建 Conformer Wav2Vec2 模型。

参数:
  • extractor_input_dim (int可选) – 特征提取器的输入维度。(默认值:64)

  • extractor_output_dim (int可选) – 特征提取器的输出维度。(默认值:256)

  • encoder_projection_dropout (float可选) – 应用于特征投影后的 dropout 概率。(默认值:0.0)

返回值:

具有 Conformer 编码器和base配置的生成的 wav2vec2 模型。

返回类型:

Wav2Vec2Model

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取针对初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并获得问题的解答

查看资源