快捷方式

TACOTRON2_GRIFFINLIM_PHONE_LJSPEECH

torchaudio.pipelines.TACOTRON2_GRIFFINLIM_PHONE_LJSPEECH

基于音素的 TTS 管道,使用在 LJSpeech [Ito 和 Johnson,2017] 上训练了 1500 个 epoch 的 Tacotron2 以及 GriffinLim 作为声码器。

文本处理器根据音素对输入文本进行编码。它使用 DeepPhonemizer 将音素转换为音素。该模型(en_us_cmudict_forward)是在 CMUDict 上训练的。

您可以在 此处 找到训练脚本。文本处理器设置为 “english_phonemes”

请参考 torchaudio.pipelines.Tacotron2TTSBundle() 以了解其用法。

示例 -“Hello world! T T S 代表文本到语音!”

Spectrogram generated by Tacotron2

示例 -“专家的检查和证词使委员会得出结论,可能发射了五枪,”

Spectrogram generated by Tacotron2

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取针对初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并获得问题的解答

查看资源