HUBERT_ASR_XLARGE¶

torchaudio.pipelines.HUBERT_ASR_XLARGE¶

HuBERT 模型（“超大型”架构），在 *Libri-Light* 数据集的 60,000 小时无标注音频上进行预训练 [Kahn et al., 2020]，并在 *LibriSpeech* 数据集的 960 小时带标注音频上针对 ASR 进行了微调 [Panayotov et al., 2015]（结合了“train-clean-100”、“train-clean-360”和“train-other-500”）。

最初由 *HuBERT* 的作者在 MIT 许可证下发布，并以相同的许可证重新分发。 [许可证, 源]