面向研究人员的 PyTorch Hub

探索和扩展来自最新尖端研究的模型。

发现并发布模型到为研究探索而设计的预训练模型库。查看适用于研究人员的模型,或了解其工作原理贡献模型

*这是一个测试版本 – 我们将在未来几个月收集反馈并改进 PyTorch Hub。

  • 重置

FastPitch 2

用于从文本生成梅尔频谱图的 FastPitch 模型

14.8千

HiFi GAN

用于从梅尔频谱图生成波形的 HiFi GAN 模型

14.8千

Tacotron 2

用于从文本生成梅尔频谱图的 Tacotron 2 模型

14.8千

WaveGlow

用于从梅尔频谱图(由 Tacotron2 生成)生成语音的 WaveGlow 模型

14.8千

Silero 语音活动检测器

预训练语音活动检测器

8600

Silero 文本转语音模型

一套紧凑的企业级多语言预训练文本转语音模型

5.8千

Silero 语音转文本模型

一套紧凑的企业级多语言预训练语音转文本模型。

5.8千

Open-Unmix

音乐源分离的参考实现

1.5千