跳转到主要内容
博客

PyTorch 新增加密人工智能和量子计算生态系统项目,扩展 PyTorch Hub

作者: 2019 年 7 月 18 日2024 年 11 月 16 日暂无评论

PyTorch 生态系统囊括了来自学术界和工业界的研究人员、应用开发者以及机器学习工程师等广大社区的项目、工具、模型和库。该生态系统的目标是支持、加速和协助您使用 PyTorch 进行探索,并帮助您推动技术前沿,无论您探索的是哪个领域。同样,我们正在扩展最近推出的 PyTorch Hub,以进一步帮助您发现和复现最新的研究成果。

在这篇文章中,我们将重点介绍今年已添加到 PyTorch 生态系统的一些项目,并提供一些我们用来评估社区项目的标准背景信息。我们还将提供关于快速发展的 PyTorch Hub 的最新动态,并分享即将到来的 PyTorch 夏季黑客马拉松的详细信息。

近期新增的生态系统项目

从隐私人工智能到量子计算,我们看到社区不断扩展到新的和有趣的领域。最新的项目包括:

  • Advertorch:一个用于对抗性鲁棒性研究的 Python 工具箱。其主要功能在 PyTorch 中实现。具体来说,AdverTorch 包含用于生成对抗性扰动和防御对抗性样本的模块,以及用于对抗性训练的脚本。
  • BoTorch:一个模块化且易于扩展的接口,用于组合贝叶斯优化原语,包括概率模型、采集函数和优化器。
  • Skorch:一个为 PyTorch 设计的高级库,提供与 scikit-learn 的完全兼容性。
  • PyTorch Geometric:一个用于在不规则输入数据(如图、点云和流形)上进行深度学习的库。
  • PySyft:一个用于加密、隐私保护深度学习的 Python 库。
  • PennyLane:一个用于量子机器学习、自动微分以及混合量子-经典计算优化的库。
  • Flair:一个用于实现顶尖自然语言处理 (NLP) 的极简框架。

什么才是一个优秀的项目?

当我们审查提交至 PyTorch 生态系统的项目时,我们会考虑一系列我们认为重要且希望在我们自己使用的项目中具备的因素。其中一些标准包括:

  1. 经过充分测试: 用户应该确信生态系统项目能与 PyTorch 良好协作,并包含对持续集成 (CI) 的支持,以确保持续进行测试,并且项目可以在最新版本的 PyTorch 上运行。
  2. 明确的实用性: 用户应该了解每个项目在 PyTorch 生态系统中的定位及其带来的价值。
  3. 宽松的许可证: 用户必须能够使用生态系统项目而无许可证方面的担忧。例如 BSD-3、Apache-2 和 MIT 许可证。
  4. 易于上手: 项目需要支持二进制安装选项(pip/Conda),提供清晰的文档和丰富的教程(最好内置于 Jupyter notebooks 中)。
  5. 持续维护: 项目作者需要致力于支持和维护他们的项目。
  6. 社区: 项目应拥有(或正在建立)一个活跃、基础广泛的社区。

如果您希望您的项目被纳入 PyTorch 生态系统并在 pytorch.org/ecosystem 上展示,请在此处填写表格 here。如果您之前提交过项目以供审议但尚未收到回复,我们承诺会尽快给您答复——我们收到了大量的提交申请!

用于可复现研究的 PyTorch Hub | 新模型

发布 PyTorch Hub 测试版以来,我们收到了社区的极大兴趣,包括许多新模型的贡献。最新的一些模型包括由杜克大学研究人员贡献的用于脑部 MRI 的 U-Net、来自 NVIDIA 的单次多框检测器 (SSD)以及来自 HuggingFace 的 Transformer-XL。

我们看到像 paperswithcode 这样的组织对 PyTorch Hub 进行了有机的集成,这让您更容易尝试人工智能研究的最新成果。此外,像 Seldon 这样的公司也为在 Kubernetes 上运行的 PyTorch Hub 模型提供生产级别的支持。

在 PyTorch Hub 中贡献模型有什么好处?

  • 兼容性: PyTorch Hub 模型是 TorchScript 和 Cloud TPU 团队优先测试的对象,并被多个领域的研究人员用作基线模型。
  • 可见性: Hub 中的模型将在 pytorch.org 以及 paperswithcode 上进行推广。
  • 易于测试和复现: 每个模型都附带代码、清晰的预处理要求以及运行所需的方法/依赖项。它还与 Google Colab 紧密集成,真正实现一键上手。

欢迎为 PyTorch Hub 做出贡献!

我们正积极寻求发展 PyTorch Hub,并欢迎各种贡献。您不必是原始论文的作者才能贡献,我们希望看到领域和学科的数量不断扩大。那么我们正在寻找什么样的贡献呢?

  • 已发表或 arXiv 论文的成果(或类似性质的、服务于不同受众的内容——例如 ULMFit),且广大受众需要。并且
  • 能够复现已发表的结果(或更好)

总体而言,这些模型面向的受众是:试图复现基线的研究人员,或试图在模型基础上进行下游研究(如特征提取或微调)的研究人员,以及寻找论文演示以进行主观评估的研究人员。贡献时请牢记这些受众。

如果您缺少灵感,或者只是想了解任何领域或学科的最新技术水平 (SOTA),请查看 Paperswithcode 的最新技术成果展厅

PyTorch 夏季黑客马拉松

下个月,我们将举办首届 PyTorch 夏季黑客马拉松。我们邀请您申请参加将于 8 月 8 日至 9 日在 Facebook 门洛帕克园区举行的线下黑客马拉松。我们将汇聚社区成员,共同致力于能够解决各种复杂挑战的创新性机器学习项目。

申请将以滚动方式进行审核和接受,直至名额满员。对于无法亲自参加此次黑客马拉松的人员,我们稍后将提供其他参与方式。

请访问此链接进行申请

感谢您成为 PyTorch 社区的一员!

- PyTorch 团队