MMS_FA¶
- torchaudio.pipelines.MMS_FA¶
基于来自 Scaling Speech Technology to 1,000+ Languages 的 1,130 种语言的 31K 小时数据进行训练 [Pratap et al., 2023]。
由 Scaling Speech Technology to 1,000+ Languages 的作者发布 [Pratap et al., 2023],遵循 [CC-BY-NC 4.0 许可]。
有关用法详情,请参阅
torchaudio.pipelines.Wav2Vec2FABundle
。注意
与其他 Wav2Vec2 包不同,此模型没有词语边界标记(如 |)。这使得对齐的后处理略有不同。