PyTorch 在达到生产规模之际，新增开发工具

此为 Facebook AI 博客上原始博文的部分转载。完整博文可在此处查看

自几个月前发布以来，PyTorch 1.0 已被迅速采纳为一款功能强大、灵活的深度学习平台，它使工程师和研究人员能够快速从研究转向生产。我们正在重点介绍 AI 工程和研究社区使用 PyTorch 1.0 的一些方式。我们还将分享有关最新版本 PyTorch 1.1 的新细节，并展示社区创建的一些新开发工具。

在 2017 年 PyTorch 初次发布的基础上，我们与 AI 社区合作，于去年 12 月发布了 PyTorch 1.0 的稳定版本。除了增强的生产导向功能和与领先云平台的深度集成，PyTorch 1.0 还扩展了开源库的核心功能，增加了 PyTorch JIT（即时编译），它可以在即时执行模式和图模式之间无缝切换，提供灵活性和速度。

各行各业的领先企业都开始使用 PyTorch，既可以促进他们的研究，也可以大规模部署，应用于翻译、计算机视觉、对话式界面、药物研究、工厂优化和自动驾驶研究等领域。PyTorch 的社区采用也持续扩大。斯坦福大学、加州大学伯克利分校、加州理工学院和其他大学正在将 PyTorch 作为其机器学习 (ML) 课程的基本工具；新的生态系统项目已经启动，以支持 PyTorch 上的开发；主要云平台也扩大了与 PyTorch 的集成。

跨行业使用 PyTorch

许多领先企业正在转向 PyTorch 1.0，以加速新 AI 系统的开发和部署。以下是一些示例：

Airbnb 利用 PyTorch 丰富的库和 API 进行对话式 AI，并部署了智能回复，帮助公司服务代理更有效地回复客户。
ATOM 正在构建一个平台，以比传统流程更快、更成功地生成和优化新的候选药物。通过使用 PyTorch 等机器学习框架，ATOM 能够设计一个变分自编码器，用于表示不同的化学结构和设计新的候选药物。
Genentech 正在利用 PyTorch 灵活的控制结构和动态图来训练深度学习模型，这将有助于开发个性化癌症疗法。
微软在其整个组织中使用 PyTorch 大规模开发机器学习模型，并通过 ONNX Runtime 部署它们。通过使用 PyTorch，Microsoft Cognition 已经构建了可扩展到数十亿单词的分布式语言模型，现在已在认知服务等产品中投入生产。
丰田研究院 (TRI) 正在通过 Toyota Guardian 和 Toyota Chauffeur 技术开发一种双管齐下的自动驾驶方法。TRI 的机器学习团队正在创建新的深度学习算法，以利用丰田每年 1000 万辆的销售数据优势。PyTorch 的灵活性大大加快了他们的探索步伐，其新的生产功能将使他们的安全关键型应用程序能够更快地部署。

在 2018 年 12 月发布 PyTorch 1.0 之后，我们现在宣布推出 v1.1，它改进了性能，增加了新的模型理解和可视化工具以提高可用性，并提供了新的 API。

PyTorch v1.1 的主要功能包括：

TensorBoard：对可视化和模型调试提供一流的原生支持，其中包含 TensorBoard，这是一个用于检查和理解训练运行和图的 Web 应用程序套件。PyTorch 现在通过简单的“from torch.utils.tensorboard import SummaryWriter”命令原生支持 TensorBoard。
JIT 编译器：即时 (JIT) 编译的改进。这包括各种错误修复以及 TorchScript 中扩展的功能，例如对字典、用户类和属性的支持。
新 API：支持布尔张量和更好地支持自定义循环神经网络。
分布式训练：提高了 CNN 等常见模型的性能，增加了对多设备模块的支持，包括在仍然使用分布式数据并行 (DDP) 的同时跨 GPU 拆分模型的能力，以及对并非所有参数都在每次迭代中都使用的模块的支持（例如控制流，如自适应 softmax 等）。有关最新教程，请点击此处。

我们还继续与社区合作，培养旨在支持机器学习工程师的项目和工具，以满足从改进模型理解到使用 AutoML 方法进行自动调优的需求。随着 Ax 和 BoTorch（下文）的发布，我们将分享我们的一些核心算法，包括用于基于历史任务高效优化超参数的元学习。我们很高兴看到这项工作开源，供社区在此基础上进行构建。

这个生态系统包括已在生产规模部署的开源项目和工具，以及我们与行业领导者合作开发的产品和服务，他们与我们有着开放和协作的 AI 社区的愿景。以下是一些最新工具：

BoTorch：BoTorch 是一个建立在 PyTorch 之上的研究框架，用于提供贝叶斯优化，这是一种用于对评估成本高昂的黑盒函数进行顺序优化的样本高效技术。
Ax：Ax 是一个用于管理自适应实验的机器学习平台。它使研究人员和工程师能够系统地探索大型配置空间，以优化机器学习模型、基础设施和产品。
PyTorch-BigGraph：PBG 是一个分布式系统，用于创建包含数十亿实体和数万亿边的超大型图的嵌入。它包括对分片和负采样的支持，并提供了基于 Wikidata 嵌入的示例用例。
Google AI Platform Notebooks：AI Platform Notebooks 是 Google Cloud Platform 提供的一项新的托管 JupyterLab 服务。数据科学家可以快速创建运行 JupyterLab 的虚拟机，并预装最新版本的 PyTorch。它还与 BigQuery、Cloud Dataproc、Cloud Dataflow 和 AI Factory 等 GCP 服务紧密集成，使得无需离开 JupyterLab 即可轻松执行完整的机器学习周期。

我们也很高兴看到更广泛的 PyTorch 社区中许多有趣的新项目。亮点包括：

BigGAN-PyTorch：这是一个完整的 PyTorch 重新实现，它使用梯度累积，可以在多达四个 GPU 上提供大批量的优势。
GeomLoss：一个 Python API，它定义了用于采样度量、图像和体积之间几何损失函数的 PyTorch 层。它包括 MMD、Wasserstein、Sinkhorn 等。

PyTorch Geometric：一个用于 PyTorch 的深度学习扩展库，它提供了多种方法，用于在图和其他不规则结构（也称为几何深度学习）上进行深度学习，这些方法来自各种已发表的论文。
Curve-GCN：一种实时、交互式图像标注方法，它使用端到端训练的图卷积网络 (GCN)。它支持通过多边形或样条线进行对象标注，从而提高了基于线条和曲线对象的标注效率。Curve-GCN 的运行速度比 Polygon-RNN++ 等传统方法快 10 倍。

Udacity、fast.ai 和其他机构开发新的 PyTorch 资源

PyTorch 非常适合教授机器学习开发，因为它通过其灵活、动态的编程环境和用户友好的 Pythonic 界面实现了快速实验。此外，Google Colab 现在提供了一个交互式 Jupyter Notebook 环境，原生支持 PyTorch，允许开发人员立即使用免费的 CPU 和 GPU 资源运行任何 PyTorch 教程。

大学课程——包括斯坦福 NLP、加州大学伯克利分校计算机视觉和加州理工学院机器人课程——现在都基于 PyTorch 进行教学。此外，大规模开放在线课程 (MOOC) 正在培训数千名新的 PyTorch 开发人员。

今天，我们宣布推出一门新的 Udacity 课程，它建立在去年推出的深度学习入门课程的基础上。这门新课程由牛津大学和 OpenMined 的 Andrew Trask 主导，涵盖了人工智能中关于隐私的重要概念，包括差分隐私和联邦学习等方法。Facebook 还将提供奖学金，支持学生在 Udacity 的完整纳米学位课程中继续他们的机器学习教育。

fast.ai 社区也继续投入精力在 PyTorch 上。6 月，fast.ai 将推出一门名为“从基础开始的深度学习”的新课程，该课程将向开发人员展示如何从头开始编写矩阵乘法，一直到如何训练和实现最先进的 ImageNet 模型。该课程将深入探讨 PyTorch 和 fast.ai 库中方法的底层实现，并使用代码来解释和说明这些方法背后的学术论文。

作为课程的一部分，fast.ai 还将发布新的软件模块，包括 fastai.audio，它将 fast.ai 深度抽象和精选算法的强大功能带到新的 PyTorch.audio 模块中，并展示 fastai.vision 如何用于通过与索尔克研究所合作，从旧经典电影等材料以及尖端显微镜序列中创建令人惊叹的高分辨率视频。此外，fast.ai 还贡献了其新的 X-ResNet 模块，其中包括一套在 ImageNet 上预训练的模型。

PyTorch 入门

AI 社区中的每个人——包括刚接触机器学习开发的人以及寻求加速其端到端工作流的研究人员和工程师——都可以通过访问pytorch.org 并在 Colab 中启动教程来即时体验 PyTorch。还有许多简单的方法可以在本地和流行的云平台上开始使用。

PyTorch 达到生产规模，新增开发工具

跨行业使用 PyTorch

Udacity、fast.ai 和其他机构开发新的 PyTorch 资源

PyTorch 入门

文档

教程

资源

保持联系以获取更新、活动信息和最新新闻