在 PyTorch 和 ExecuTorch 中推进低比特算子:动态内核选择、KleidiAI 和量化绑定嵌入
TorchAO 为 Arm CPU 带来了高性能的低比特线性和嵌入算子。在本次更新中,我们……
在 Opacus 中启用完全分片数据并行(FSDP2)
介绍与背景 Opacus 在支持大规模模型的私有训练方面取得了重大进展……
Sai Aparna Aketi, Huanyu Zhang2025 年 7 月 7 日
PyTorch + vLLM = ♥️
核心要点:PyTorch 和 vLLM 对 AI 生态系统都至关重要,并且越来越……
Simon Mo, Woosuk Kwon, Kaichao You, The PyTorch Team @Meta2025 年 6 月 25 日
FlagGems 加入 PyTorch 生态系统:由 Triton 驱动的通用 AI 加速算子库
在跨多种 AI 硬件加速大型语言模型的竞赛中,FlagGems 提供了……
FlagGems 团队2025 年 6 月 25 日
容错 Llama:在 Crusoe L40S 上每约 15 秒模拟 2000 次故障且无检查点进行训练
合作者:Less Wright, Howard Huang, Chien-Chin Huang, Crusoe: Martin Cala, Ethan Petersen 总结:我们使用了……
Tristan Rice, Howard Huang2025 年 6 月 20 日
DeepNVMe:为深度学习应用提供经济实惠的 I/O 扩展
简介 我们在 2024 年夏天推出了 DeepNVMe,作为一套优化方案,用于解决 I/O 瓶颈问题……
Joe Mayer, Logan Adams, Olatunji Ruwase2025 年 6 月 17 日
开源 AI 正在改变经济——数据揭示了真相
博客交叉发布在 Linux 基金会博客上。当我们接近 2025 年中点时,……
Frank Nagle, 哈佛商学院战略部助理教授兼 Linux 基金会首席经济顾问2025 年 6 月 4 日
用你自己的“黄队” LLM 构建负责任的 AI 产品
我们用来构建 AI 的工具正在快速发展,而 PyTorch 处于核心位置……
Zach Lasiuk, Arm 首席解决方案设计师2025 年 6 月 4 日
PyTorch 杭州 Meetup 回顾:探索 AI 开源生态与前沿技术实践
5 月 17 日,PyTorch Meetup 在杭州成功举办,吸引了近 60 名开发者……
PyTorch 基金会2025 年 5 月 27 日
使用 Triton 加速 GPU 性能:4 月 30 日 PyTorch ATX 活动
由 Red Hat 赞助的 PyTorch ATX Triton 活动于 2025 年 4 月 30 日举行,……