跳转到主要内容
博客

适用于 AMD ROCm™ 平台的 PyTorch 现已作为 Python 包提供

随着 PyTorch 1.8 版本的发布,我们很高兴地宣布,在 ROCm™ 开放软件平台上使用 PyTorch 的用户现在有了一个新的安装选项。一个可安装的 Python 包现已托管在 pytorch.org 上,并附带了本地安装说明,其格式与适用于仅 CPU 配置和其他 GPU 平台的 PyTorch 包一样简单、可选择。ROCm 上的 PyTorch 包含使用 AMD MIOpen 和 RCCL 库进行混合精度和大规模训练的完整功能。这为数据科学家、研究人员、学生和社区中的其他人提供了一个新选项,可以使用 AMD GPU 开始加速 PyTorch。

ROCm 生态系统

ROCm 是 AMD 针对 GPU 加速高性能计算和机器学习的开源软件平台。自 2016 年 ROCm 初次发布以来,ROCm 平台已发展到支持更多库和工具、更广泛的 Linux® 发行版以及一系列新 GPU。这包括基于 AMD CDNA™ 架构的首款 GPU AMD Instinct™ MI100。

ROCm 生态系统对 PyTorch 的支持历史悠久,最初是作为 PyTorch 项目的一个分支实现的,最近则通过上游 PyTorch 代码中的 ROCm 支持实现。PyTorch 用户可以使用 AMD 的公共 PyTorch Docker 镜像安装适用于 ROCm 的 PyTorch,当然也可以从源代码构建适用于 ROCm 的 PyTorch。随着 PyTorch 1.8 的发布,这些现有的安装选项现在得到了可安装 Python 包的补充。

ROCm 的主要重点始终是高性能计算的规模化。ROCm 和 AMD Instinct 系列数据中心 GPU 的组合能力特别适合数据中心规模的高性能计算挑战。PyTorch 自然适合这个环境,因为 HPC 和 ML 工作流变得更加紧密地交织在一起。

ROCm 上的 PyTorch 入门

此 PyTorch 构建的范围是支持 ROCm 的 AMD GPU,在 Linux 上运行。ROCm 支持的 GPU 包括 AMD Instinct 系列中所有以计算为重点的数据中心 GPU,以及其他一些精选 GPU。支持的 GPU 的最新列表可在 ROCm Github 存储库中找到。确认目标系统包含支持的 GPU 和当前 ROCm 4.0.1 版本后,PyTorch 的安装遵循与其他 Python 包相同的简单基于 Pip 的安装。与适用于其他平台的 PyTorch 构建一样,https://pytorch.ac.cn/get-started/locally/ 上的配置器提供了要运行的特定命令行。

适用于 ROCm 的 PyTorch 是从上游 PyTorch 存储库构建的,是一个功能齐全的实现。值得注意的是,它包括对多 GPU 分布式训练的支持,并支持加速混合精度训练。

更多信息

ROCm 支持的 GPU 和操作系统的列表可在 https://github.com/RadeonOpenCompute/ROCm 找到。ROCm 平台的通用文档可在 https://rocmdocs.amd.com/en/latest/ 找到。ROCm 学习中心位于 https://developer.amd.com/resources/rocm-resources/rocm-learning-center/。有关 AMD 针对 HPC 和 ML 产品的通用信息可在 https://amd.com/hpc 找到。

反馈

活跃的用户群是 PyTorch 生态系统极其重要的一部分。我们将非常感谢您在 PyTorch 讨论论坛上就 ROCm 上的 PyTorch 体验提供反馈,并在适当情况下通过 Github 报告任何问题。