流行 NLP Transformers 的 PyTorch 实现
148.1k
Ultralytics YOLOv5 🚀 用于目标检测、实例分割和图像分类。
55.0k
用于英法和英德翻译的 Transformer 模型。
31.7k
带 ResNet-50、ResNet-101 和 MobileNet-V3 主干的 DeepLabV3 模型
17.1k
2012 年 ImageNet 冠军,其 top-5 错误率为 15.3%,比亚军低 10.8 个百分点以上。
17.1k
AlexNet 级别的精度,参数量减少 50 倍。
17.1k
密集卷积网络 (DenseNet),以前馈方式将每一层连接到其他所有层。
17.1k
2014 年 ImageNet ILSVRC 挑战赛的获奖卷积网络
17.1k
带有 ResNet-50 和 ResNet-101 主干的全卷积网络模型
17.1k
GoogLeNet 基于一个代号为“Inception”的深度卷积神经网络架构,该网络赢得了 2014 年 ImageNet 比赛。
17.1k
又称 GoogleNetv3,一个著名的、在 ImageNet 上训练的 2015 年卷积网络
17.1k
为速度和内存优化的高效网络,带有残差块
17.1k
在 ImageNet 上预训练的深度残差网络
17.1k
一个为速度和内存优化的高效卷积网络,在 ImageNet 上预训练
17.1k
用于从文本生成梅尔频谱图的 FastPitch 模型
14.4k
GPUNet 是一系列新的卷积神经网络,旨在最大化 NVIDIA GPU 和 TensorRT 的性能。
14.4k
EfficientNets 是一系列图像分类模型,它们实现了最先进的精度,同时尺寸和速度提高了一个数量级。使用 Tensor Cores 进行混合精度训练。
14.4k
用于从梅尔频谱图生成波形的 HiFi GAN 模型
14.4k
使用 Tensor Cores 进行混合精度训练的 ResNet50 模型。
14.4k
将 ResNet 中瓶颈 3x3 卷积替换为 3x3 分组卷积的 ResNet,使用 Tensor Cores 进行混合精度训练。
14.4k
添加了 Squeeze-and-Excitation 模块的 ResNeXt,使用 Tensor Cores 进行混合精度训练。
14.4k
用于从文本生成梅尔频谱图的 Tacotron 2 模型
14.4k
用于从梅尔频谱图(由 Tacotron2 生成)生成语音的 WaveGlow 模型
14.4k
一套紧凑的企业级多语言预训练语音转文本模型。
5.4k
一套紧凑的企业级多语言预训练文本转语音模型
5.4k
MiDaS 模型用于从单个图像计算相对深度。
5.1k
通过廉价操作生成更多特征的高效网络
4.3k
受大脑启发的、带有脉冲神经元的多层感知器
4.3k
在 Kinetics 400 数据集上预训练的 ResNet 风格视频分类网络
3.5k
在 Kinetics 400 数据集上预训练的 SlowFast 网络
3.5k
在 Kinetics 400 数据集上预训练的 X3D 网络
3.5k
在 BDD100K 数据集上预训练的 YOLOP
2.1k
一次性(OFA)将训练和搜索解耦,并在各种边缘设备和资源限制下实现高效推理。
1.9k
一个简单的用于 64x64 图像的生成式图像模型
1.6k
时尚、名人面孔的高质量图像生成
1.6k
为不同的硬件平台无代理地专门化 CNN 架构。
1.4k
具有域/外观不变性的网络
806
带批量归一化的U-Net,用于生物医学图像分割,预训练权重用于脑部MRI中的异常分割
755
使用知识蒸馏提升小型高效模型。
696
HybridNets – 端到端感知网络
648
使用亿级弱监督数据训练的 ResNext 模型。
601
在 ImageNet 上预训练的 Harmonic DenseNet
370
在“Billion scale semi-supervised learning for image classification”论文中介绍的 ResNet 和 ResNext 模型
244
让我们保持简单,使用简单的架构超越更深、更复杂的架构
53
使用此细粒度图像分类器对鸟类进行分类
35