作者:PyTorch 团队

PyTorch 生态系统包含来自学术界和工业界的广泛研究人员、应用程序开发者和机器学习工程师的各类项目、工具、模型和库。这个生态系统的目标是支持、加速并帮助您探索 PyTorch,无论您正在探索哪个领域,都能助您突破技术前沿。同样,我们正在扩展近期推出的 PyTorch Hub,以进一步帮助您发现和重现最新研究成果。

在这篇博文中,我们将重点介绍今年添加到 PyTorch 生态系统中的一些项目,并提供我们用于评估社区项目的标准背景信息。我们还将提供快速发展的 PyTorch Hub 的最新情况,并分享即将举行的 PyTorch 夏季黑客马拉松的详细信息。

近期新增的生态系统项目

从隐私人工智能到量子计算,我们看到社区不断扩展到新的有趣领域。最新的项目包括:

  • Advertorch:一个用于对抗鲁棒性研究的 Python 工具箱。其主要功能在 PyTorch 中实现。具体来说,AdverTorch 包含用于生成对抗性扰动、防御对抗性示例的模块,以及用于对抗训练的脚本。

  • botorch:一个模块化且易于扩展的接口,用于组合贝叶斯优化原语,包括概率模型、采集函数和优化器。

  • Skorch:一个为 PyTorch 提供完整 scikit-learn 兼容性的高级库。

  • PyTorch Geometric:一个用于在图、点云和流形等不规则输入数据上进行深度学习的库。

  • PySyft:一个用于加密、隐私保护深度学习的 Python 库。

  • PennyLane:一个用于量子机器学习、自动微分和混合量子经典计算优化的库。

  • Flair:一个用于最先进自然语言处理 (NLP) 的非常简单的框架。

优秀项目的要素是什么?

当我们审查 PyTorch 生态系统的项目提交时,我们会考虑一些我们认为很重要且在我们自己使用的项目中也希望具备的因素。其中一些标准包括:

  1. 充分测试: 用户应该相信生态系统项目能与 PyTorch 良好协作,并应包含 CI 支持,以确保持续进行测试且项目能在最新版本的 PyTorch 上运行。
  2. 明确的用途: 用户应该理解每个项目在 PyTorch 生态系统中的定位及其带来的价值。
  3. 宽松的许可: 用户必须能够在没有许可顾虑的情况下使用生态系统项目。例如 BSD-3、Apache-2 和 MIT 许可证。
  4. 便捷的上手体验: 项目需要支持二进制安装选项(pip/Conda)、清晰的文档以及丰富的教程(最好是 Jupyter notebook 形式)。
  5. 持续维护: 项目作者需要致力于支持和维护他们的项目。
  6. 社区: 项目应该拥有(或正在建设)一个活跃的、基础广泛的社区。

如果您希望您的项目被纳入 PyTorch 生态系统并在 pytorch.org/ecosystem 上展示,请填写这里的表格。如果您之前提交过项目进行审查但尚未收到回复,我们承诺会尽快回复您——我们收到了很多提交!

PyTorch Hub:可重现研究 | 新模型

PyTorch Hub 启动 beta 版本以来,我们收到了来自社区的广泛关注,包括贡献了许多新模型。最新的一些模型包括杜克大学研究人员贡献的用于脑部 MRI 的 U-Net、NVIDIA 的 Single Shot Detection 和 HuggingFace 的 Transformer-XL。

我们看到 paperswithcode 等机构自然地集成了 PyTorch Hub,让您更容易尝试人工智能研究的最新成果。此外,像 Seldon 这样的公司在 Kubernetes 之上为 PyTorch Hub 模型提供生产级支持。

向 PyTorch Hub 贡献模型有什么好处?

  • 兼容性: PyTorch Hub 模型优先由 TorchScript 和 Cloud TPU 团队进行测试,并作为多个领域研究人员的基准。

  • 可见性: Hub 中的模型将在 pytorch.orgpaperswithcode 上进行推广。

  • 易于测试和重现: 每个模型都包含代码、清晰的预处理要求以及运行所需的方法/依赖项。此外,它还与 Google Colab 紧密集成,真正实现一键上手。

欢迎向 PyTorch Hub 贡献!

我们正在积极寻求壮大 PyTorch Hub 并欢迎贡献。您无需是原始论文作者即可贡献,我们非常希望看到涵盖的领域和学科范围扩大。那么,我们正在寻找哪些类型的贡献呢?

  • 已发表论文或 arXiv 论文的成果(或服务于不同受众的类似性质成果,例如 ULMFit),这些成果应是广大受众所需的。

    AND

  • 重现已发表的结果(或更好)

总的来说,这些模型面向的研究人员包括:尝试重现基准模型的研究人员,尝试在模型基础上进行下游研究(例如特征提取或微调)的研究人员,以及寻求论文演示以进行主观评估的研究人员。贡献时请牢记这些受众。

如果您缺乏灵感或只是想了解任何给定领域或学科的 SOTA(最先进水平),请查看 Paperswithcode 的最先进成果展示

PyTorch 夏季黑客马拉松

我们将于下月举办首届 PyTorch 夏季黑客马拉松。我们诚挚邀请您申请参加于 8 月 8 日至 9 日在 Facebook 门洛帕克校区举行的线下黑客马拉松。我们将召集社区成员,共同开展能够解决广泛复杂挑战的创新机器学习项目。

申请将按收到顺序进行审查和接受,直至名额满为止。对于无法亲自参加本次黑客马拉松的人员,我们稍后将公布其他参与方式。

请访问此链接进行申请

感谢您成为 PyTorch 社区的一员!

-PyTorch 团队