欢迎使用 PyTorch 教程¶ PyTorch 教程的新增功能? 分布式流水线并行简介 Libuv TCPStore 后端简介 使用分布式检查点 (DCP) 进行异步保存 Python 自定义运算符 更新了 DeviceMesh 入门 学习基础知识 熟悉 PyTorch 的概念和模块。在本快速入门指南中,了解如何加载数据、构建深度神经网络、训练和保存模型。 PyTorch 入门 PyTorch 案例 小巧、可直接部署的 PyTorch 代码示例。 探索案例 全部 学习基础知识 使用 PyTorch 构建完整机器学习工作流程的分步指南。 入门 YouTube 上的 PyTorch 简介 使用 PyTorch 构建完整机器学习工作流程的简介。跟随 YouTube 上的 PyTorch 入门系列。 入门 通过示例学习 PyTorch 本教程通过独立的示例介绍 PyTorch 的基本概念。 入门 torch.nn 究竟是什么? 使用 torch.nn 创建和训练神经网络。 入门 使用 TensorBoard 可视化模型、数据和训练 学习使用 TensorBoard 可视化数据和模型训练。 可解释性,入门,TensorBoard TorchVision 对象检测微调教程 微调预训练的 Mask R-CNN 模型。 图像/视频 计算机视觉迁移学习教程 使用迁移学习训练用于图像分类的卷积神经网络。 图像/视频 优化 Vision Transformer 模型 将最先进的、基于注意力的 Transformer 模型应用于计算机视觉任务。 图像/视频 对抗样本生成 使用迁移学习训练用于图像分类的卷积神经网络。 图像/视频 DCGAN 教程 训练生成对抗网络 (GAN) 以生成新的名人。 图像/视频 空间变换网络教程 了解如何使用视觉注意力机制增强网络。 图像/视频 使用 TIAToolbox 进行全切片图像推理 了解如何使用 TIAToolbox 对全切片图像执行推理。 图像/视频 基于 USB 的半监督学习教程 了解如何使用 USB 和 PyTorch 训练半监督学习算法(使用自定义数据)。 图像/视频 音频输入/输出 学习使用 torchaudio 加载数据。 音频 音频重采样 学习使用 torchaudio 对音频波形进行重采样。 音频 音频数据增强 学习使用 torchaudio 应用数据增强。 音频 音频特征提取 学习使用 torchaudio 提取特征。 音频 音频特征增强 学习使用 torchaudio 增强特征。 音频 音频数据集 学习使用 torchaudio 数据集。 音频 使用 torchaudio 中的 Wav2Vec2 进行自动语音识别 了解如何使用 torchaudio 的预训练模型构建语音识别应用程序。 音频 语音命令分类 了解如何正确格式化音频数据集,然后在数据集上训练/测试音频分类器网络。 音频 使用 torchaudio 进行文本到语音转换 了解如何使用 torchaudio 的预训练模型构建文本到语音转换应用程序。 音频 使用 torchaudio 中的 Wav2Vec2 进行强制对齐 了解如何使用 torchaudio 的 Wav2Vec2 预训练模型来对齐文本和语音 音频 使用 Better Transformer 进行快速 Transformer 推理 使用 Better Transformer 部署 PyTorch Transformer 模型,以实现高性能推理 生产,文本 NLP 从零开始:使用字符级 RNN 对姓名进行分类 从零开始构建和训练一个基本的字符级 RNN,无需使用 torchtext 即可对单词进行分类。这是三个教程系列中的第一个。 文本 NLP 从零开始:使用字符级 RNN 生成姓名 在使用字符级 RNN 对姓名进行分类之后,学习如何从语言中生成姓名。这是三个教程系列中的第二个。 文本 NLP 从零开始:使用序列到序列网络和注意力机制进行翻译 这是“NLP 从零开始”的第三个也是最后一个教程,我们将编写自己的类和函数来预处理数据,以完成我们的 NLP 建模任务。 文本 使用 Torchtext 进行文本分类 了解如何使用 torchtext 库构建数据集并对文本进行分类。 文本 使用 Transformer 进行语言翻译 使用 Transformer 从零开始训练语言翻译模型。 文本 使用 Torchtext 预处理自定义文本数据集 了解如何使用 torchtext 准备自定义数据集 文本 (可选)使用 TorchDynamo 后端将 PyTorch 模型导出到 ONNX,并使用 ONNX Runtime 运行它 在 PyTorch 中构建图像分类器模型,并将其转换为 ONNX,然后再使用 ONNX Runtime 部署它。 生产,ONNX,后端 ONNX Registry 简介 演示如何使用 ONNX Registry 端到端地解决不支持的运算符。 生产,ONNX,后端 强化学习 (DQN) 了解如何使用 PyTorch 在 OpenAI Gym 的 CartPole-v0 任务上训练深度 Q 学习 (DQN) 智能体。 强化学习 使用 TorchRL 进行强化学习 (PPO) 了解如何使用 PyTorch 和 TorchRL 在 Gym 的 Inverted Pendulum 任务上训练近端策略优化智能体。 强化学习 训练一个玩马里奥游戏的强化学习代理 使用 PyTorch 训练双 Q 学习智能体玩马里奥游戏。 强化学习 循环 DQN 使用 TorchRL 训练循环策略 强化学习 编写 DDPG 损失函数 使用 TorchRL 编写 DDPG 损失函数 强化学习 编写您的环境和变换 使用 TorchRL 编写 Pendulum 环境 强化学习 使用 Flask 通过 REST API 在 Python 中部署 PyTorch 使用 Flask 部署 PyTorch 模型,并使用预训练的 DenseNet 121 模型(用于检测图像)的示例公开 REST API 以进行模型推理。 生产 TorchScript 简介 TorchScript 简介,它是 PyTorch 模型(nn.Module 的子类)的中间表示,可以在高性能环境(例如 C++)中运行。 生产,TorchScript 在 C++ 中加载 TorchScript 模型 了解 PyTorch 如何提供从现有 Python 模型到序列化表示的转换,该表示可以完全从 C++ 加载和执行,而无需依赖 Python。 生产,TorchScript (可选)使用 TorchScript 后端将 PyTorch 模型导出到 ONNX,并使用 ONNX Runtime 运行它 将 PyTorch 中定义的模型转换为 ONNX 格式,然后使用 ONNX Runtime 运行它。 生产,ONNX PyTorch 性能分析 了解如何分析 PyTorch 应用程序 性能分析 _static/img/thumbnails/default.png PyTorch 性能分析 整体跟踪分析简介 性能分析 _static/img/thumbnails/default.png PyTorch 性能分析 使用整体跟踪分析进行跟踪比较 性能分析 _static/img/thumbnails/default.png 在 FX 中构建卷积/批归一化融合器 构建一个简单的 FX pass,将批归一化融合到卷积中,以提高推理性能。 FX 使用 FX 构建简单的性能分析器 构建一个简单的 FX 解释器,以记录运算符、模块和函数调用的运行时间,并报告统计信息 FX (测试版)PyTorch 中的通道最后内存格式 概述通道最后内存格式,并了解如何使用它在内存中对 NCHW 张量进行排序,同时保留维度。 内存格式,最佳实践,前端 API 使用 PyTorch C++ 前端 通过训练 DCGAN(一种生成模型)来生成 MNIST 数字图像,逐步完成使用 C++ 前端训练模型的端到端示例。 前端 API,C++ Python 自定义运算符登录页面 这是与 PyTorch 中的自定义运算符相关的所有内容的登录页面。 扩展 PyTorch,前端 API,C++,CUDA Python 自定义运算符 使用 Python 创建自定义运算符。对于将 Python 函数黑盒化以用于 torch.compile 很有用。 扩展 PyTorch,前端 API,C++,CUDA 自定义 C++ 和 CUDA 运算符 如何使用自定义 C++ 和 CUDA 运算符扩展 PyTorch。 扩展 PyTorch,前端 API,C++,CUDA 自定义 C++ 和 CUDA 扩展 使用 numpy 创建一个没有参数的神经网络层。然后使用 scipy 创建一个具有可学习权重的神经网络层。 扩展 PyTorch,前端 API,C++,CUDA 使用自定义 C++ 运算符扩展 TorchScript 在 C++ 中实现自定义 TorchScript 运算符,如何将其构建到共享库中,如何在 Python 中使用它来定义 TorchScript 模型,以及最后如何将其加载到 C++ 应用程序中以进行推理工作负载。 扩展 PyTorch,前端 API,TorchScript,C++ 使用自定义 C++ 类扩展 TorchScript 这是自定义运算符教程的延续,介绍了我们为将 C++ 类同时绑定到 TorchScript 和 Python 中而构建的 API。 扩展 PyTorch,前端 API,TorchScript,C++ TorchScript 中的动态并行 本教程介绍了在 TorchScript 中执行*动态互操作并行*的语法。 前端 API,TorchScript,C++ 在 Raspberry Pi 4 上进行实时推理 本教程介绍如何在 Raspberry Pi 4 上以 30 fps 的速度运行量化和融合的模型。 TorchScript,模型优化,图像/视频,量化 C++ 前端中的自动微分 autograd 包有助于构建灵活和动态的神经网络。在本教程中,探索在 PyTorch C++ 前端中执行自动微分的几个示例 前端 API,C++ 在 C++ 中注册调度运算符 调度器是 PyTorch 的一个内部组件,负责确定在调用 torch::add 等函数时实际应该运行哪些代码。 扩展 PyTorch,前端 API,C++ 为 C++ 中的新后端扩展调度器 了解如何扩展调度器,以添加位于 pytorch/pytorch 仓库之外的新设备,并维护它以与原生 PyTorch 设备保持同步。 扩展 PyTorch,前端 API,C++ 通过 PrivateUse1 促进新的后端集成 了解如何集成位于 pytorch/pytorch 仓库之外的新后端,并维护它以与原生 PyTorch 后端保持同步。 扩展 PyTorch,前端 API,C++ 自定义函数教程:双向反向传播 了解如何编写支持双向反向传播的自定义自动微分函数。 扩展 PyTorch,前端 API 自定义函数教程:融合卷积和批归一化 了解如何创建一个自定义自动微分函数,将批归一化融合到卷积中以提高内存使用率。 扩展 PyTorch,前端 API 前向模式自动微分 了解如何使用前向模式自动微分。 前端 API 雅可比矩阵、海森矩阵、hvp、vhp 等 了解如何使用 torch.func 计算高级自动微分量 前端 API 模型集成 了解如何使用 torch.vmap 进行模型集成 前端 API 每样本梯度 了解如何使用 torch.func 计算每样本梯度 前端 API 神经正切核 了解如何使用 torch.func 计算神经正切核 前端 API PyTorch 中的性能分析 了解如何使用 PyTorch Profiler 对模块的性能进行基准测试。 模型优化,最佳实践,性能分析 TensorBoard 中的性能分析 了解如何使用 TensorBoard 插件分析模型的性能。 模型优化,最佳实践,性能分析,TensorBoard 超参数调整教程 了解如何使用 Ray Tune 为模型找到性能最佳的超参数集。 模型优化,最佳实践 参数化教程 了解如何使用 torch.nn.utils.parametrize 对参数施加约束(例如,使其正交、对称正定、低秩...) 模型优化,最佳实践 剪枝教程 了解如何使用 torch.nn.utils.prune 对神经网络进行稀疏化,以及如何扩展它以实现您自己的自定义剪枝技术。 模型优化,最佳实践 如何通过将优化器步骤融合到反向传播中来节省内存 通过使用内存快照将优化器步骤融合到反向传播中来学习节省内存的技术。 模型优化,最佳实践,CUDA,前端 API (测试版)使用半结构化稀疏性加速 BERT 训练 BERT,将其剪枝为 2:4 稀疏,然后使用半结构化稀疏性和 torch.compile 对其进行加速,以实现 2 倍的推理速度提升。 文本,模型优化 (测试版)LSTM 词语言模型的动态量化 将动态量化(最简单的量化形式)应用于基于 LSTM 的下一个单词预测模型。 文本,量化,模型优化 (测试版)BERT 的动态量化 将动态量化应用于 BERT(来自 Transformer 的双向编码器表示)模型。 文本,量化,模型优化 (测试版)计算机视觉量化迁移学习教程 使用量化模型扩展计算机视觉迁移学习教程。 图像/视频,量化,模型优化 (测试版)PyTorch 中的 Eager 模式静态量化 本教程展示了如何进行训练后静态量化。 量化 从基本原理理解 PyTorch Intel CPU 性能 使用英特尔® Extension for PyTorch 优化的 TorchServe 推理框架案例研究。 模型优化,生产 从基本原理理解 PyTorch Intel CPU 性能(第 2 部分) 使用英特尔® Extension for PyTorch 优化的 TorchServe 推理框架案例研究(第 2 部分)。 模型优化,生产 使用 Ax 进行多目标神经架构搜索 了解如何使用 Ax 搜索架构,以找到准确性和延迟之间的最佳权衡。 模型优化,最佳实践,Ax,TorchX torch.compile 教程 使用最新的 PyTorch 编译器解决方案 torch.compile,以最少的代码更改来加速您的模型。 模型优化 Inductor CPU 后端调试和性能分析 了解使用 Inductor CPU 后端的 ``torch.compile`` 的用法、调试和性能分析。 模型优化 (测试版)使用缩放点积注意力机制实现高性能 Transformer 本教程探讨了新的 torch.nn.functional.scaled_dot_product_attention 以及如何使用它来构建 Transformer 组件。 模型优化,注意力机制,Transformer 卷积神经网络中的知识蒸馏 了解如何使用更强大的模型作为教师来提高轻量级模型的准确性。 模型优化,图像/视频 PyTorch 分布式概述 简要介绍分布式包中的所有概念和功能。使用本文档找到最适合您的应用程序的分布式训练技术。 并行和分布式训练 PyTorch 中的分布式数据并行 - 视频教程 这一系列视频教程将指导您完成通过 DDP 在 PyTorch 中进行分布式训练。 并行和分布式训练 单机模型并行最佳实践 了解如何实现模型并行,这是一种将单个模型拆分到不同 GPU 上的分布式训练技术,而不是在每个 GPU 上复制整个模型 并行和分布式训练 分布式数据并行入门 了解何时使用分布式数据并行与数据并行的基础知识,并通过一个示例进行设置。 并行和分布式训练 使用 PyTorch 编写分布式应用程序 设置 PyTorch 的分布式包,使用不同的通信策略,并介绍该包的一些内部结构。 并行和分布式训练 使用张量并行进行大规模 Transformer 模型训练 了解如何使用张量并行包训练大型模型。 并行和分布式训练 使用 Cpp 扩展自定义进程组后端 使用自定义集体通信实现扩展 ProcessGroup。 并行和分布式训练 分布式 RPC 框架入门 了解如何使用 torch.distributed.rpc 包构建分布式训练。 并行和分布式训练 使用分布式 RPC 框架实现参数服务器 通过一个使用 PyTorch 的分布式 RPC 框架实现参数服务器的简单示例进行讲解。 并行和分布式训练 分布式流水线并行简介 演示如何使用 torch.distributed.pipelining 实现流水线并行 并行和分布式训练 使用异步执行实现批处理 RPC 处理 了解如何使用 rpc.functions.async_execution 实现批处理 RPC 并行和分布式训练 将分布式数据并行与分布式 RPC 框架相结合 通过一个简单示例,了解如何将分布式数据并行与分布式模型并行相结合。 并行和分布式训练 完全分片数据并行 (FSDP) 入门 了解如何使用完全分片数据并行包训练模型。 并行和分布式训练 使用完全分片数据并行 (FSDP) 进行高级模型训练 探索使用完全分片数据并行包进行的高级模型训练。 并行和分布式训练 Libuv TCPStore 后端简介 TCPStore 现在使用新的服务器后端来实现更快的连接和更好的可扩展性。 并行和分布式训练 导出到 ExecuTorch 教程 了解如何使用 ExecuTorch,这是一个用于将 PyTorch 模型降低到边缘设备的统一 ML 堆栈。 边缘 在 C++ 中运行 ExecuTorch 模型教程 了解如何在 C++ 中加载和执行 ExecuTorch 模型 边缘 使用 ExecuTorch SDK 对模型进行性能分析 探索如何使用 ExecuTorch SDK 对 ExecuTorch 模型进行性能分析、调试和可视化 边缘 构建 ExecuTorch iOS 演示应用程序 探索如何设置 ExecuTorch iOS 演示应用程序,该应用程序使用 MobileNet v3 模型利用三个不同的后端(XNNPACK、Core ML 和 Metal Performance Shaders (MPS))来处理实时摄像头图像。 边缘 构建 ExecuTorch Android 演示应用程序 了解如何使用 DeepLab v3 模型和 XNNPACK FP32 后端设置 ExecuTorch Android 演示应用程序以执行图像分割任务。 边缘 将模型降低为代理 学习如何通过三种方法应用代理来使用 ExecuTorch 加速程序:降低整个模块、将其与另一个模块组合以及对模块的一部分进行分区。 边缘 TorchRec 简介 TorchRec 是一个 PyTorch 领域库,旨在提供大规模推荐系统所需的常见稀疏性和并行性原语。 TorchRec,推荐系统 探索 TorchRec 分片 本教程介绍了使用 EmbeddingPlanner 和 DistributedModelParallel API 对嵌入表进行分片的方案。 TorchRec,推荐系统 TorchMultimodal 简介 TorchMultimodal 是一个库,提供了用于训练多模态任务的模型、原语和示例 TorchMultimodal 其他资源¶ PyTorch 示例 一组关于视觉、文本、强化学习中 PyTorch 的例子,您可以将其整合到您现有的工作中。 查看示例 PyTorch 小抄 PyTorch 基本元素的快速概览。 打开 GitHub 上的教程 从 GitHub 访问 PyTorch 教程。 前往 GitHub 在 Google Colab 上运行教程 了解如何将教程数据复制到 Google Drive,以便您可以在 Google Colab 上运行教程。 打开