PyTorch 和 ExecuTorch 中低位操作符的进展:动态内核选择、KleidiAI 和量化绑定的嵌入
TorchAO 为 Arm CPU 带来了高性能的低位线性算子和嵌入算子。在此次更新中,我们……
在 Opacus 中启用完全分片数据并行 (FSDP2)
引言和背景 Opacus 在支持大规模模型的私有训练方面取得了显著进展……
Sai Aparna Aketi, Huanyu Zhang2025 年 7 月 7 日
PyTorch + vLLM = ♥️
主要收获:PyTorch 和 vLLM 对 AI 生态系统都至关重要,并且日益……
Simon Mo, Woosuk Kwon, Kaichao You, PyTorch 团队 @Meta2025 年 6 月 25 日
FlagGems 加入 PyTorch 生态系统:由 Triton 驱动的操作符库,实现通用 AI 加速
在跨多种 AI 硬件加速大型语言模型的竞赛中,FlagGems 提供了……
FlagGems 团队2025 年 6 月 25 日
容错 Llama:在 Crusoe L40S 上每隔约 15 秒发生 2000 次模拟故障且无检查点训练
协作者:Less Wright, Howard Huang, Chien-Chin Huang, Crusoe: Martin Cala, Ethan Petersen tl;dr:我们使用了……
Tristan Rice, Howard Huang2025 年 6 月 20 日
DeepNVMe:深度学习应用中经济实惠的 I/O 扩展
引言 我们在 2024 年夏季推出了 DeepNVMe,作为一系列优化方案,旨在解决深度学习应用中的 I/O 瓶颈……
Joe Mayer, Logan Adams, Olatunji Ruwase2025 年 6 月 17 日
开源 AI 正在改变经济——数据表明了什么
博客交叉发布在 Linux 基金会博客。随着我们接近 2025 年中旬,……
Frank Nagle,哈佛商学院战略部门助理教授兼 Linux 基金会首席经济学家顾问2025 年 6 月 4 日
用你自己的 Yellow Teaming LLM 构建负责任的 AI 产品
我们用来构建 AI 的工具正在迅速发展,PyTorch 是其核心……
Zach Lasiuk,Arm 首席解决方案设计师2025 年 6 月 4 日