torchaudio.models.wav2vec2_xlsr_300m¶

torchaudio.models.wav2vec2_xlsr_300m(encoder_projection_dropout: float = 0.0, encoder_attention_dropout: float = 0.0, encoder_ff_interm_dropout: float = 0.0, encoder_dropout: float = 0.0, encoder_layer_drop: float = 0.0, aux_num_out: Optional[int] = None) → Wav2Vec2Model[source]¶

构建 XLS-R 模型 [Babu et al., 2021]，参数量为 3 亿。该架构与 Wav2Vec2 模型 [Baevski et al., 2020] 兼容，因此输出类是 Wav2Vec2Model。

参数:

encoder_projection_dropout (float) – 请参阅 wav2vec2_model()。
encoder_attention_dropout (float) – 请参阅 wav2vec2_model()。
encoder_ff_interm_dropout (float) – 请参阅 wav2vec2_model()。
encoder_dropout (float) – 请参阅 wav2vec2_model()。
encoder_layer_drop (float) – 请参阅 wav2vec2_model()。
aux_num_out (int, optional) – 请参阅 wav2vec2_model()。

返回:

返回的模型。

返回类型:

Wav2Vec2Model

torchaudio.models.wav2vec2_xlsr_300m¶

文档

教程

资源