WAV2VEC2_BASE¶
- torchaudio.pipelines.WAV2VEC2_BASE¶
Wav2vec 2.0 模型(“基础”架构),在来自 *LibriSpeech* 数据集 [Panayotov 等人,2015] 的 960 小时未标记音频(“train-clean-100”、“train-clean-360”和“train-other-500”的组合)上进行预训练,未进行微调。
最初由 *wav2vec 2.0* 的作者 [Baevski 等人,2020] 在 MIT 许可下发布,并以相同的许可证重新发布。[许可证,来源]
请参考
torchaudio.pipelines.Wav2Vec2Bundle
以了解其用法。