2024 年 10 月 25 日
PyTorch 2.5 现已支持英特尔 GPU
PyTorch® 2.5 现已支持英特尔 GPU,为包括英特尔® Arc™ 独立显卡、内置英特尔® Arc™ 显卡的英特尔®酷睿™ Ultra 处理器和英特尔®数据中心 GPU Max 系列在内的英特尔 GPU 提供了改进的功能和性能。这一集成将英特尔 GPU 和 SYCL* 软件栈纳入了官方 PyTorch 栈,确保了一致的用户体验,并支持更广泛的 AI 应用场景,特别是在 AI PC 领域。
2024 年 10 月 24 日
ExecuTorch Beta:设备端 AI 和大型语言模型 (LLMs)、稳定性以及与合作伙伴共同加速
ExecuTorch 凭借 v0.4 版本达到了 Beta 状态,提供了稳定的 API 和运行时,以及广泛的内核覆盖。ExecuTorch 是推荐用于 Llama 3.2 1B/3B 模型的设备端推理引擎,为原始模型和量化模型都提供了增强的性能和内存效率。ExecuTorch 的采用率和生态系统增长显著增加,目前重点在于提高非 CPU 后端的可靠性、性能和覆盖范围...
2024 年 10 月 23 日
TorchRec 和 FBGEMM 1.0 稳定版发布
我们很高兴宣布 TorchRec 和 FBGEMM 发布 1.0 稳定版本。TorchRec 是 PyTorch 原生的推荐系统库,由 FBGEMM(Facebook 通用矩阵乘法)的高效、低级别内核提供支持。
2024 年 10 月 17 日
PyTorch 2.5 发布博客
我们很高兴宣布 PyTorch® 2.5 发布 (发布说明)!此版本为 SDPA 提供了一个新的 cuDNN 后端,默认情况下为在 H100 或更新 GPU 上使用 SDPA 的用户提供加速。此外,torch.compile 的区域编译提供了一种减少 torch.compile 冷启动时间的方法,允许用户编译重复的 nn.Module(例如 LLM 中的 Transformer 层)而无需重新编译。最后,TorchInductor CPP 后端提供了坚实的性能加速和众多...
2024 年 10 月 15 日
在 Windows CPU 上实现 PyTorch 性能提升之路
与 Linux 相比,PyTorch 在 Windows 上的 CPU 性能较低一直是一个显著问题。导致这种性能差异的因素有很多。通过我们的调查,我们确定了导致 Windows CPU 性能不佳的几个原因,其中两个主要问题是:Windows 默认的 malloc 内存分配器效率低下,以及 Windows 平台上缺乏用于矢量化优化的 SIMD。在本文中,我们将展示 PyTorch CPU 如何...
2024 年 10 月 8 日
PyTorch 基金会技术咨询委员会选举新领导层
我们很高兴宣布 PyTorch 基金会技术咨询委员会 (TAC) 的首任主席和副主席:Luca Antiga 担任主席,Jiong Gong 担任副主席。两位领导者都拥有丰富的经验并对 PyTorch 社区深具承诺,他们将指导 TAC 完成其促进开放、多元和创新 PyTorch 技术社区的使命。认识新领导层:Luca Antiga 自 2022 年起担任 Lightning AI 的 CTO。他是 PyTorch 的早期贡献者...
2024 年 10 月 2 日
2024 年 PyTorch 大会回顾:热情如火 🔥
2024 年旧金山 PyTorch 大会汇聚了近 1,500 名 AI 研究人员、开发者和爱好者。为期两天的活动包括引人入胜的讨论、富有洞察力的主题演讲以及聚焦人工智能 (AI) 和领先开源机器学习框架 PyTorch 最新进展的实践环节。与会者深入探讨了生成式 AI、大型语言模型 (LLMs) 的未来,以及开源技术在推动 AI 创新中的关键作用。以下是...