跳转到主要内容
公告社区

改进深度学习工作流程:PyTorch 生态系统工具

作者: 2024 年 5 月 11 日2025 年 4 月 30 日暂无评论

欢迎来到蓬勃发展的 PyTorch 生态系统,这里有丰富的工具和库,专门用于提升您作为开发人员或研究人员在深度学习方面的体验。生态系统工具页面汇集了来自学术界、工业界、应用程序开发和机器学习领域的专家们的众多项目。

最初,PyTorch 的目标是建立一个繁荣的社区,让开发人员能够访问彼此的工具,进行有意义的讨论,并探索社区内可用的丰富资源。

如今,PyTorch 生态系统已发展壮大,拥有 100 多个根据您的需求量身定制的项目,提供强大的支持、更快的速度以及与 PyTorch 的轻松集成。如果您的项目符合我们的使命,我们邀请您提交它,加入这个充满活力的生态系统。

本月,我们将所有生态系统博客移至 PyTorch.org 网站,以便为我们的社区提供一个展示最新创新成果的空间。请继续阅读,了解生态系统中的最新项目!

探索生态系统中的最新工具和框架

随着我们进入 2024 年,我们很高兴展示一系列令人印象深刻的生态系统工具,它们极大地丰富了 PyTorch 社区。这些工具涵盖了广泛的领域,包括姿态估计、性能分析,甚至量子计算。让我们逐一探讨,亲眼见证它们如何重塑 PyTorch 格局,为开发人员开辟激动人心的可能性。

Anomalib

Anomalib 是一个深度学习库,旨在收集最先进的异常检测算法,用于在公共和私人数据集上进行基准测试。Anomalib 提供了最近文献中描述的几种即用型异常检测算法的实现,以及一套有助于开发和实现自定义模型的工具。该库强烈关注基于图像的异常检测,其算法目标是识别数据集中的异常图像或图像内的异常像素区域。Anomalib 不断更新最新的算法和训练/推理扩展。

Diffusers

Diffusers 是用于生成图像、音频甚至分子 3D 结构的最先进预训练扩散模型的首选库。无论您是寻求简单的推理解决方案还是训练自己的扩散模型,Diffusers 都是一个支持两者的模块化工具箱。

Pomegranate

Pomegranate 是一个多功能机器学习库,与 PyTorch 无缝集成。它为概率建模任务提供了广泛的概率模型和工具。Pomegranate 赋能用户构建复杂模型,例如隐马尔可夫模型 (HMM)、贝叶斯网络和高斯混合模型 (GMM)。通过结合 PyTorch 和 Pomegranate 的优势,开发人员可以利用深度学习和概率建模的力量来解决各种机器学习挑战。

PyPose

PyPose 是一个基于 PyTorch 的库,专为姿态估计任务设计。通过 PyPose,开发人员可以高效地训练和部署用于人体姿态估计的模型,这是一个基本的计算机视觉问题。通过利用 PyTorch 的灵活性和性能,PyPose 简化了构建准确姿态估计模型的过程。其直观的 API 和预训练模型使其成为研究人员和开发人员探索人体姿态估计应用的绝佳选择。

PyPOTS

一个用于使用 PyTorch 处理部分观测时间序列的数据挖掘的 Python 工具箱/库,包括支持不完整(不规则采样)多元时间序列中缺失值的数据补全、分类、聚类和预测任务的 SOTA 模型。

OctoML Profiler

OctoML Profiler 是一种性能分析工具,有助于优化 PyTorch 模型。该工具可帮助开发人员识别其深度学习模型中的性能瓶颈和低效率。通过提供对内存使用、计算时间v和数据移动的见解,OctoML Profiler 使开发人员能够微调其模型以提高效率。通过这些有价值的反馈,开发人员可以优化其模型,以便在各种硬件平台上部署。

Open Compass

OpenCompass 是一款大模型评估一站式平台,旨在为大模型评估提供一个公平、开放、可复现的基准。其主要特点包括:全面支持模型和数据集、高效的分布式评估、多样化的评估范式、高可扩展性的模块化设计以及实验管理和报告机制。

Renate

Renate 是一个基于 PyTorch 的神经网络架构搜索 (NAS) 库。它简化了自动搜索针对特定任务量身定制的最佳神经网络架构的过程。Renate 利用强化学习和进化算法等技术来有效探索架构空间。通过使用 Renate,开发人员可以节省大量时间和资源,同时发现高性能模型。

RoMa

RoMa 是一个独立的库,用于处理 PyTorch 中的旋转表示(旋转矩阵、四元数、旋转向量等)。它旨在实现鲁棒性、易用性和效率。

Substra

Substra 是一个开源的联邦学习 (FL) 软件。它支持在分布式数据集上训练和验证机器学习模型。它提供了一个灵活的 Python 接口和一个 Web 应用程序,可以大规模运行联邦学习训练。Substra 的主要用途是在生产环境中。它已被医院和生物技术公司部署和使用。Substra 也可以在单机上用于执行 FL 模拟和调试代码。

TorchQuantum

TorchQuantum 是一个功能强大的库,它将 PyTorch 框架与量子计算概念相结合。它使开发人员能够探索量子机器学习算法并构建混合经典-量子模型。通过将量子计算原理集成到 PyTorch 中,TorchQuantum 为解决传统深度学习方法可能难以解决的复杂问题开辟了新的可能性。

TIAToolbox

TIAToolbox(Text-Image-Augmentation Toolbox)是一个 PyTorch 库,旨在为深度学习任务增强文本和图像数据。它提供了一套全面的数据增强工具,包括转换、噪声注入和图像/文本合成。通过应用 TIAToolbox,开发人员可以丰富他们的训练数据集,提高模型泛化能力,并增强其深度学习模型的鲁棒性。

torchdistill

torchdistill 是一个基于 PyTorch 构建的免代码框架,用于可重现的深度学习和知识蒸馏研究。该框架旨在让用户通过声明性 PyYAML 配置文件设计实验,并支持高级模块抽象。

TorchOpt

TorchOpt 是一个专注于深度学习优化算法的 PyTorch 库。它提供了最先进的优化技术集合,例如随机梯度下降 (SGD) 变体、自适应学习率方法和优化调度。TorchOpt 赋能开发人员高效地微调其模型,更快地收敛,并在各种深度学习任务中实现更好的性能。

USB

USB,或统一语音到文本基准,是一个基于 PyTorch 的工具包,用于训练和评估语音识别模型。它提供标准化数据集和评估指标,以促进不同语音识别架构之间的公平准确比较。通过使用 USB,研究人员和开发人员可以将其模型与最先进的系统进行基准测试,并推动自动语音识别领域的进步。

Zeus

Zeus 是深度学习能量测量和优化领域当前最先进的技术。它具有监控组件,允许用户测量 GPU 能耗,以及优化器组件,可根据监控组件的测量结果自动优化 DNN 或 GPU 参数。

成为我们生态系统的一部分

我们多样化的生态系统工具是 PyTorch 成功的关键。它们为姿态估计、概率建模、性能分析、模型可解释性、语音识别、量子计算、数据增强、优化和神经网络架构搜索等任务提供必要的支持。

利用这些工具可以赋能开发人员和研究人员加速其深度学习工作流程,并在 AI 领域开启新的可能性。

您的工具是否适合PyTorch 生态系统?如果您能回答以下问题,我们很乐意邀请您提交您的工具进行审查

  1. 您的项目是否补充了 PyTorch,增强了用户体验,引入了新功能,或加速了训练和推理过程?
    • 示例可以包括可视化工具、内核库或用于在特定领域(如 NLP)进行研究的框架。
  2. 项目是否已准备好供广大开发人员使用?
    • 例如,项目是否稳定,是否会得到维护,以及是否有足够的支持基础设施、文档和技术支持以允许开发人员成功使用它?

感谢我们生态系统中的所有贡献者和合作者!祝 2024 年一切顺利。