WAVLM_BASE_PLUS¶
- torchaudio.pipelines.WAVLM_BASE_PLUS¶
WavLM Base+ 模型(“base” 架构),在 60,000 小时的 Libri-Light 数据集 [Kahnet al.,2020]、10,000 小时的 GigaSpeech [Chenet al.,2021] 和 24,000 小时的 VoxPopuli [Wanget al.,2021] 上预训练,未进行微调。
最初由 WavLM [Chenet al.,2022] 的作者根据 MIT 许可证发布,并以相同的许可证重新分发。[许可证,来源]
请参考
torchaudio.pipelines.Wav2Vec2Bundle
以了解用法。