博客 – PyTorch - PyTorch 深度学习库

博客

vLLM 北京见面会：推进大规模 LLM 部署

2025 年 8 月 2 日，腾讯北京总部举办了一场该领域的重大活动……

vLLM 团队2025 年 8 月 7 日

博客

推进 PyTorch 和 ExecuTorch 中的低比特运算符：动态内核选择、KleidiAI 和量化绑定嵌入

TorchAO 为 Arm CPU 带来了高性能的低比特线性和嵌入算子。在本次更新中，我们……

Scott Roy, Digant Desai, Ed Miller, Gian Marco Iodice, Ronan Naughton2025 年 8 月 7 日

博客

PyTorch 2.8 发布博客

我们很高兴地宣布 PyTorch® 2.8（发布说明）的发布！此版本包含：…

PyTorch 基金会2025 年 8 月 6 日

Kubeflow Trainer Joins PyTorch Ecosystem

博客生态系统

PyTorch on Kubernetes：Kubeflow Trainer 加入 PyTorch 生态系统

我们很高兴地宣布，Kubeflow Trainer 项目已集成到 PyTorch 中……

Andrey Velichkevich, Apple; Yuki Iwai, CyberAgent, Inc.; Yuan Tang, Red Hat; Antonin Stefanutti, Red Hat; Johnu George, Nutanix2025 年 7 月 28 日

博客

torch.compile 和 Diffusers：达到巅峰性能的实践指南

Diffusers 是一个首选库，它为前沿和开放的扩散模型提供了统一的接口……

Sayak Paul (Hugging Face), Animesh Jain (Meta), Benjamin Bossan (Hugging Face)2025 年 7 月 17 日

博客

在 Opacus 中启用完全分片数据并行（FSDP2）

介绍与背景 Opacus 在支持大规模模型的私有训练方面取得了重大进展……

Sai Aparna Aketi, Huanyu Zhang2025 年 7 月 7 日

博客

使用 PyTorch DCP 减少分布式检查点的存储空间和带宽占用

摘要 PyTorch 分布式检查点 (DCP) 是一个多功能且强大的工具，用于管理模型检查点……

Meta: Sibasish Acharya, Marc Horowitz, Pradeep Fernando, Saurabh Mishra IBM: Saransh Gupta, Swaminathan Sundararaman, Raghu Ganti2025 年 7 月 2 日

博客

PyTorch + vLLM = ♥️

核心要点：PyTorch 和 vLLM 对 AI 生态系统都至关重要，并且越来越……

Simon Mo, Woosuk Kwon, Kaichao You, The PyTorch Team @Meta2025 年 6 月 25 日

博客生态系统

FlagGems 加入 PyTorch 生态系统：由 Triton 驱动的通用 AI 加速算子库

在跨多种 AI 硬件加速大型语言模型的竞赛中，FlagGems 提供了……

FlagGems 团队2025 年 6 月 25 日

博客

介绍 Flux Fast：让 Flux 在 H100 上飞速运行

在我们之前的文章 diffusion-fast 中，我们展示了 Stable Diffusion XL (SDXL) 流水线如何……

Joel Schlosser (Meta), Christian Puhrsch (Meta), and Sayak Paul (Hugging Face)2025 年 6 月 25 日

博客

容错 Llama：在 Crusoe L40S 上每约 15 秒模拟 2000 次故障且无检查点进行训练

合作者：Less Wright, Howard Huang, Chien-Chin Huang, Crusoe: Martin Cala, Ethan Petersen 总结：我们使用了……

Tristan Rice, Howard Huang2025 年 6 月 20 日

PyTorch Docathon 2025 Top Community Contributors

博客

PyTorch Docathon 2025：活动总结

衷心祝贺并万分感谢所有参与 PyTorch Docathon 的杰出参与者……

PyTorch 基金会2025 年 6 月 18 日

博客

DeepNVMe：为深度学习应用提供经济实惠的 I/O 扩展

简介我们在 2024 年夏天推出了 DeepNVMe，作为一套优化方案，用于解决 I/O 瓶颈问题……

Joe Mayer, Logan Adams, Olatunji Ruwase2025 年 6 月 17 日

博客

ParetoQ：极低比特 LLM 量化中的缩放定律

大型语言模型领域正朝着低精度计算的方向发展。这一转变需要……

Zechun Liu, Changsheng Zhao, Hanxian Huang, Sijia Chen, Jing Zhang, Andrew Or, Jiawei Zhao, Scott Roy, Lisa Jin, Yunyang Xiong, Yangyang Shi, Lin Xiao, Yuandong Tian, Bilge Soran, Raghuraman Krishnamoorthi, Tijmen Blankevoort, Vikas Chandra (Meta)2025 年 6 月 13 日

博客

PyTorch 分布式检查点支持 HuggingFace Safetensors

摘要 PyTorch 分布式检查点 (DCP) 正在投入资源解决互操作性障碍，以确保……

Ankita George, Saurabh Mishra, Joe Cummings, Philip Bontrager, Daulet Askarov, Teja Rao, Chien-Chin Huang, Ela Krepska, Jafar Taghiyar2025 年 6 月 6 日

博客

介绍 PyTorch 生态系统工作组和项目聚焦

PyTorch 生态系统可以追溯到几年前，其最早的一些项目如 Hugging……

PyTorch 生态系统工作组2025 年 6 月 5 日

The Economic and Workforce Impacts of Open Source AI

博客

开源 AI 正在改变经济——数据揭示了真相

博客交叉发布在 Linux 基金会博客上。当我们接近 2025 年中点时，……

Frank Nagle, 哈佛商学院战略部助理教授兼 Linux 基金会首席经济顾问2025 年 6 月 4 日

博客

用你自己的“黄队” LLM 构建负责任的 AI 产品

我们用来构建 AI 的工具正在快速发展，而 PyTorch 处于核心位置……

Zach Lasiuk, Arm 首席解决方案设计师2025 年 6 月 4 日

博客

PyTorch 杭州 Meetup 回顾：探索 AI 开源生态与前沿技术实践

5 月 17 日，PyTorch Meetup 在杭州成功举办，吸引了近 60 名开发者……

PyTorch 基金会2025 年 5 月 27 日

社区

使用 Triton 加速 GPU 性能：4 月 30 日 PyTorch ATX 活动

由 Red Hat 赞助的 PyTorch ATX Triton 活动于 2025 年 4 月 30 日举行，……

Jason Meaux, ATX PyTorch Leader Stephen Watt, VP and Distinguished Engineer, Red Hat2025 年 5 月 20 日

博客