目录

快捷方式

torchaudio.prototype.models.emformer_hubert_base¶

torchaudio.prototype.models.emformer_hubert_base(extractor_input_dim: int = 80, extractor_output_dim: int = 128, encoder_dropout: float = 0.1, aux_num_out: Optional[int] = None) → Wav2Vec2Model[源代码]¶

构建具有 20 个 Emformer 层的 Emformer HuBERT 模型。

参数：

extractor_input_dim (int, 可选) – 特征提取器的输入维度。(默认值：80)
extractor_output_dim (int, 可选) – 特征提取器后的输出维度。(默认值：128)
encoder_dropout (float, 可选) – Emformer 中的 Dropout 概率。(默认值：0.1)
aux_num_out (int 或 None, 可选) – 用于微调的辅助层的输出维度。(默认值：None)

返回：

结果 torchaudio.models.Wav2Vec2Model 模型，包含一个 torchaudio.models.Emformer 编码器。

返回类型：

文档

访问 PyTorch 全面的开发者文档

查看文档

教程

获取面向初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获得问题解答

查看资源