跳转到主要内容

面向研究人员的 PyTorch Hub

探索和扩展来自最新尖端研究的模型。

发现并发布模型到为研究探索设计的预训练模型库。查看适用于研究人员的模型,或了解其工作原理贡献模型

*这是一个测试版本 – 我们将在未来几个月收集反馈并改进 PyTorch Hub。

  • 重置

PyTorch-Transformers

流行 NLP Transformers 的 PyTorch 实现

148.1k

YOLOv5

Ultralytics YOLOv5 🚀 用于目标检测、实例分割和图像分类。

55.0k

Transformer (NMT)

用于英法和英德翻译的 Transformer 模型。

31.7k

RoBERTa

一种稳健优化的 BERT 预训练方法

31.7k

Deeplabv3

带 ResNet-50、ResNet-101 和 MobileNet-V3 主干的 DeepLabV3 模型

17.1k

AlexNet

2012 年 ImageNet 冠军,其 top-5 错误率为 15.3%,比亚军低 10.8 个百分点以上。

17.1k

SqueezeNet

AlexNet 级别的精度,参数量减少 50 倍。

17.1k

DenseNet

密集卷积网络 (DenseNet),以前馈方式将每一层连接到其他所有层。

17.1k

VGG-Nets

2014 年 ImageNet ILSVRC 挑战赛的获奖卷积网络

17.1k

FCN

带有 ResNet-50 和 ResNet-101 主干的全卷积网络模型

17.1k

Wide ResNet

宽残差网络

17.1k

GoogLeNet

GoogLeNet 基于一个代号为“Inception”的深度卷积神经网络架构,该网络赢得了 2014 年 ImageNet 比赛。

17.1k

Inception_v3

又称 GoogleNetv3,一个著名的、在 ImageNet 上训练的 2015 年卷积网络

17.1k

MobileNet v2

为速度和内存优化的高效网络,带有残差块

17.1k

ResNet

在 ImageNet 上预训练的深度残差网络

17.1k

ResNeXt

下一代 ResNet,更高效、更精确

17.1k

ShuffleNet v2

一个为速度和内存优化的高效卷积网络,在 ImageNet 上预训练

17.1k

FastPitch 2

用于从文本生成梅尔频谱图的 FastPitch 模型

14.4k

GPUNet

GPUNet 是一系列新的卷积神经网络,旨在最大化 NVIDIA GPU 和 TensorRT 的性能。

14.4k

EfficientNet

EfficientNets 是一系列图像分类模型,它们实现了最先进的精度,同时尺寸和速度提高了一个数量级。使用 Tensor Cores 进行混合精度训练。

14.4k

HiFi GAN

用于从梅尔频谱图生成波形的 HiFi GAN 模型

14.4k

ResNet50

使用 Tensor Cores 进行混合精度训练的 ResNet50 模型。

14.4k

ResNeXt101

将 ResNet 中瓶颈 3x3 卷积替换为 3x3 分组卷积的 ResNet,使用 Tensor Cores 进行混合精度训练。

14.4k

SE-ResNeXt101

添加了 Squeeze-and-Excitation 模块的 ResNeXt,使用 Tensor Cores 进行混合精度训练。

14.4k

SSD

用于目标检测的单发多框检测器模型

14.4k

Tacotron 2

用于从文本生成梅尔频谱图的 Tacotron 2 模型

14.4k

WaveGlow

用于从梅尔频谱图(由 Tacotron2 生成)生成语音的 WaveGlow 模型

14.4k

Silero 语音活动检测器

预训练语音活动检测器

6.5k

Silero 语音转文本模型

一套紧凑的企业级多语言预训练语音转文本模型。

5.4k

Silero 文本转语音模型

一套紧凑的企业级多语言预训练文本转语音模型

5.4k

MiDaS

MiDaS 模型用于从单个图像计算相对深度。

5.1k

GhostNet

通过廉价操作生成更多特征的高效网络

4.3k

SNNMLP

受大脑启发的、带有脉冲神经元的多层感知器

4.3k

3D ResNet

在 Kinetics 400 数据集上预训练的 ResNet 风格视频分类网络

3.5k

SlowFast

在 Kinetics 400 数据集上预训练的 SlowFast 网络

3.5k

X3D

在 Kinetics 400 数据集上预训练的 X3D 网络

3.5k

ResNeSt

ResNet 的一个新变体。

3.3k

YOLOP

在 BDD100K 数据集上预训练的 YOLOP

2.1k

一次性(Once-for-All)

一次性(OFA)将训练和搜索解耦,并在各种边缘设备和资源限制下实现高效推理。

1.9k

FashionGen 上的 DCGAN

一个简单的用于 64x64 图像的生成式图像模型

1.6k

渐进式增长 GAN (PGAN)

时尚、名人面孔的高质量图像生成

1.6k

ProxylessNAS

为不同的硬件平台无代理地专门化 CNN 架构。

1.4k

Open-Unmix

音乐源分离的参考实现

1.4k

IBN-Net

具有域/外观不变性的网络

806

用于脑部MRI的U-Net

带批量归一化的U-Net,用于生物医学图像分割,预训练权重用于脑部MRI中的异常分割

755

MEAL_V2

使用知识蒸馏提升小型高效模型。

696

HybridNets

HybridNets – 端到端感知网络

648

ResNext WSL

使用亿级弱监督数据训练的 ResNext 模型。

601

HarDNet

在 ImageNet 上预训练的 Harmonic DenseNet

370

半监督和半弱监督 ImageNet 模型

在“Billion scale semi-supervised learning for image classification”论文中介绍的 ResNet 和 ResNext 模型

244

SimpleNet

让我们保持简单,使用简单的架构超越更深、更复杂的架构

53

ntsnet

使用此细粒度图像分类器对鸟类进行分类

35