TACOTRON2_WAVERNN_CHAR_LJSPEECH¶
- torchaudio.pipelines.TACOTRON2_WAVERNN_CHAR_LJSPEECH¶
基于字符的 TTS pipeline,使用在 LJSpeech [Ito and Johnson, 2017] 上训练了 1,500 个 epoch 的
Tacotron2,以及在 LJSpeech [Ito and Johnson, 2017] 的 8 位深度波形上训练了 10,000 个 epoch 的WaveRNN声码器。文本处理器逐字符编码输入文本。
您可以在此处找到训练脚本。 使用了以下参数:
win_length=1100、hop_length=275、n_fft=2048、mel_fmin=40和mel_fmax=11025。您可以在此处找到训练脚本。
请参考
torchaudio.pipelines.Tacotron2TTSBundle()以了解用法。示例 - “Hello world! T T S stands for Text to Speech!”
示例 - “The examination and testimony of the experts enabled the Commission to conclude that five shots may have been fired,”