HUBERT_ASR_XLARGE¶
- torchaudio.pipelines.HUBERT_ASR_XLARGE¶
HuBERT 模型(“超大型”架构),在 *Libri-Light* 数据集的 60,000 小时无标注音频上进行预训练 [Kahn et al., 2020],并在 *LibriSpeech* 数据集的 960 小时带标注音频上针对 ASR 进行了微调 [Panayotov et al., 2015](结合了“train-clean-100”、“train-clean-360”和“train-other-500”)。
最初由 *HuBERT* 的作者在 MIT 许可证下发布,并以相同的许可证重新分发。 [许可证, 源]
请参阅
torchaudio.pipelines.Wav2Vec2ASRBundle
了解用法。