TACOTRON2_GRIFFINLIM_PHONE_LJSPEECH¶
- torchaudio.pipelines.TACOTRON2_GRIFFINLIM_PHONE_LJSPEECH¶
基于音素的 TTS 管道,使用在 LJSpeech 上训练了 1,500 个 epoch 的
Tacotron2
[Ito and Johnson, 2017] 和GriffinLim
作为声码器。文本处理器基于音素编码输入文本。它使用 DeepPhonemizer 将字素转换为音素。该模型 (en_us_cmudict_forward) 在 CMUDict 上训练。
您可以在此处找到训练脚本。文本处理器设置为 “english_phonemes”。
有关用法,请参阅
torchaudio.pipelines.Tacotron2TTSBundle()
。示例 - “Hello world! T T S stands for Text to Speech!”
示例 - “The examination and testimony of the experts enabled the Commission to conclude that five shots may have been fired,”