torchaudio.models.hubert_base¶

torchaudio.models.hubert_base(encoder_projection_dropout: float = 0.1, encoder_attention_dropout: float = 0.1, encoder_ff_interm_dropout: float = 0.0, encoder_dropout: float = 0.1, encoder_layer_drop: float = 0.05, aux_num_out: Optional[int] = None) → Wav2Vec2Model[source]¶

根据 HuBERT 构建“base” HuBERT 模型 [Hsu 等, 2021]

参数：

encoder_projection_dropout (float) – 参见 wav2vec2_model()。
encoder_attention_dropout (float) – 参见 wav2vec2_model()。
encoder_ff_interm_dropout (float) – 参见 wav2vec2_model()。
encoder_dropout (float) – 参见 wav2vec2_model()。
encoder_layer_drop (float) – 参见 wav2vec2_model()。
aux_num_out (int 或 None, 可选) – 参见 wav2vec2_model()。

返回：

结果模型。

返回类型：

Wav2Vec2Model

torchaudio.models.hubert_base¶

文档

教程

资源