实现最高 41% 的预训练提速:在 B200 上使用 TorchTitan 和 MXFP8 以及 DeepEP 进行 DeepSeek-V3 训练

简而言之:通过 PyTorch 与 Nebius 的联合开发,我们成功支持了 DeepSeek-V3 混合专家模型 (MoE) 的训练……
PyTorch 2.10+TorchAO:在 Intel® Core™ Ultra 第三代处理器上赋能 AIPC 场景

概览:我们很高兴为您介绍 Intel® Core™ Ultra 第三代处理器的亮点……
Intel PyTorch 及客户端 AI 软件团队2026年3月20日
面向 MoE 的 MXFP8 训练:在 GB200 集群上结合 TorchAO 和 TorchTitan,使 Llama4 Scout 的训练速度较 BF16 提升 1.3 倍

简而言之:我们近期展示了 Llama4 Scout 的训练速度提升了 30.2%,且收敛效果与……相当
KubeCon + CloudNativeCon + OpenInfra Summit + PyTorch Conference China 2026 提案征集与注册现已开启

KubeCon + CloudNativeCon + …… 的提案征集和注册工作现已全面启动。
PyTorch 基金会2026年3月11日
KernelAgent:通过多智能体编排进行硬件引导的 GPU 内核优化

总结:近日,PyTorch 团队发布了 KernelAgent,这是一个开源的智能体系统,在……方面实现了 100% 的正确性
FlexAttention + FlashAttention-4:既快又灵活

简而言之:在 Hopper 和 Blackwell GPU 上,FlexAttention 现已具备 FlashAttention-4 后端。我们增加了对……的支持
使用 ExecuTorch 和 Arm 将 PyTorch 模型部署到微边缘设备

AI 的世界正在超越云端,触及到……的小型设备
Dominica Abena Oforiwaa Amanfo2026年3月5日
Kubetorch 加入 PyTorch 生态系统:面向机器学习、在 Kubernetes 上运行的快速、Pythonic 且具备容错能力的接口

Kubetorch 助力在 Kubernetes 上进行 ML 研究与开发,涵盖训练、推理、强化学习、评估、数据处理等……
Paul Yang, Donny Greenberg2026年2月27日
随着智能体 AI 需求增长,PyTorch 基金会宣布迎来新成员

基金会欢迎 Clockwork.io, Emmi AI, NIPA, Nota AI., Yasp, CommonAI CIC, 卡内基梅隆大学, 莫纳什大学……
PyTorch 基金会2026年2月24日
Pyrefly 现已支持 PyTorch 类型检查

我们很高兴分享 PyTorch 现已利用 Pyrefly 来支持我们代码库中的类型检查……
Meta PyTorch 和 Pyrefly 团队2026年2月12日









