2026年3月

2026年3月25日暂无评论

March 2026 Newsletter Header

欢迎阅读3月刊的 PyTorch 基金会简讯。本期内容包括:PyTorch 2.11 的发布及即将举行的在线问答直播、PyTorch 欧洲大会日程安排、KubeCon + CloudNativeCon + OpenInfra Summit + PyTorch 中国大会 2026 的报名启动、新成员入会公告等。

公告

PyTorch 2.11 Release
PyTorch 2.11 现已正式发布:我们很高兴地宣布 PyTorch 2.11 发布,此次更新包含来自 432 位贡献者的 2,723 次提交。主要更新包括:分布式训练的可微集合通信(Differentiable Collectives)、适用于 Hopper/Blackwell 架构上 FlexAttention 的 FlashAttention-4 后端,以及针对 Apple Silicon 扩展的 MPS 算子支持。阅读发布说明 >>
PyTorch Conference China 2026
KubeCon + CloudNativeCon + OpenInfra Summit + PyTorch 中国大会 2026 征稿与报名开启:将于 9 月 8-9 日在上海联合举办的盛会现已开放演讲征集(CFP)和参会注册。提交演讲议题 >>
New PyTorch Members
随着 Agentic AI 需求增长,PyTorch 基金会宣布新成员加入:基金会近期迎来了九位新成员,包括 Clockwork.io、Emmi AI、Nota AI 和 yasp.ai。此次扩容将有力支持开源 AI 基础设施的快速发展。

近期活动

OpenEnv AI 黑客松(印度):Meta、Hugging Face 和 PyTorch 联合举办了印度首届 OpenEnv AI 黑客松。利用 Meta 的开源强化学习框架构建学习环境,即有机会赢取 30,000 美元的奖金池。第一轮线上比赛将于 3 月 25 日开始4 月 3 日前注册 >>
优化 AI 大会(Optimized AI Conference):欢迎参加于亚特兰大举办的优化 AI 大会(3 月 30-31 日),PyTorch 基金会将作为社区合作伙伴参与其中;欢迎莅临我们的展位与团队交流。了解详情 >>
PyTorch 2.11 Webinar
PyTorch 2.11 发布在线问答:太平洋时间 3 月 31 日上午 10 点,加入 Andrey Talman 和 Nikita Shulga 的直播,深入了解 2.11 版本的技术细节。议题涵盖可微集合通信、RNN/LSTM GPU 导出以及 XPU Graph。在此注册 >>
PyTorch Conference Europe 2026
PyTorch 欧洲大会 2026:会议日程已公布,将于 4 月 7-8 日在巴黎举行。大会设有 8 个专题、超过 95 场技术讲座,内容涵盖大语言模型的音频模态、C++ 包装模式以及负责任的 AI 工程。立即注册 >>
GPU MODE IRL 黑客松(巴黎):PyTorchCon EU 之后,本次技术冲刺活动将于 4 月 9 日举行,专注于 ML 系统优化和 LLM 竞速。参与者可使用 NVIDIA Blackwell Ultra 集群,尝试从零开始预训练一个 LLM。了解详情 >>

近期活动回顾

PyTorch Day India Recap
PyTorch Day India 2026 回顾:这场在班加罗尔举办的开发者活动吸引了 460 名现场参与者,通过技术讲座和互动讨论,促进了印度开源 AI 社区的深入协作。
PyTorch at NVIDIA GTC
NVIDIA GTC 2026 上的 PyTorch:维护者们在圣何塞展示了高性能 AI 集成技术。重点演示包括用于内核编写的全新 Helion 框架以及 ExecuTorch 部署方案。
PyTorch Helion 黑客松:3 月 14 日,开发者们齐聚旧金山,参与了一场专注于利用 Helion 框架进行 GPU 内核编写与性能优化的实践活动。

成员动态汇总

Intel Core Ultra AI PC
Intel:利用 PyTorch 2.10 解锁 Intel® Core™ Ultra 系列 3 处理器的 AI 能力 — 强调了 XPU 后端的进步,包括集成 TorchAO 以实现无缝的 int4 量化。
DeepSpeed Multimodal Efficiency
Snowflake:增强多模态训练与内存效率 — 通过 DeepSpeed 更新实现了 30% 的加速及峰值内存占用 40% 的降低
KernelAgent
Meta:KernelAgent:硬件引导下的 GPU 内核优化 — 引入了一种代理系统,相较于默认的 torch.compile 可实现 1.56 倍的加速
MXFP8 Training
Meta:MoE 的 MXFP8 训练 — 展示了在 GB200 集群上使用 TorchAO 和 TorchTitan,Llama4 Scout 的训练速度相较于 bf16 实现了 +30.2% 的加速
订阅PyTorch通讯
直接订阅接收最新简讯:https://pytorch.ac.cn/newsletter/