快捷方式

TACOTRON2_WAVERNN_CHAR_LJSPEECH

torchaudio.pipelines.TACOTRON2_WAVERNN_CHAR_LJSPEECH

基于字符的 TTS 管道,使用 Tacotron2LJSpeech [Ito 和 Johnson, 2017] 上训练了 1,500 个 epoch,使用 WaveRNN 声码器在 LJSpeech [Ito 和 Johnson, 2017] 的 8 位深度波形上训练了 10,000 个 epoch。

文本处理器逐个字符地对输入文本进行编码。

您可以在 此处 找到训练脚本。使用了以下参数:win_length=1100hop_length=275n_fft=2048mel_fmin=40mel_fmax=11025

您可以在 此处 找到训练脚本。

请参阅 torchaudio.pipelines.Tacotron2TTSBundle() 以了解用法。

示例 - “Hello world! T T S stands for Text to Speech!”

Spectrogram generated by Tacotron2

示例 - “The examination and testimony of the experts enabled the Commission to conclude that five shots may have been fired,”

Spectrogram generated by Tacotron2

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取针对初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获得问题的解答

查看资源