在移动设备上释放AI的力量:使用ExecuTorch和KleidiAI对Llama 3.2量化模型进行LLM推理 博客 在移动设备上释放 AI 的力量:使用 ExecuTorch 和 KleidiAI 对 Llama 3.2 量化模型进行 LLM 推理 引言:在最近的 PyTorch 大会上,Arm 强调了其技术在诸多领域的广泛影响,包括……Gian Marco Iodice (Arm) 和 Digant Desai (Meta)2024年10月28日
三步轻松入门 PyTorch、ExecuTorch 和 Ethos-U85 博客 通过三个简单步骤开始使用 PyTorch、ExecuTorch 和 Ethos-U85 ExecuTorch 对 Ethos-U85 的支持 在机器学习快速发展的环境中,PyTorch 已成为……Robert Elliott、Fredrik Knutsson 和 Mark Quartermain2024年10月28日
PyTorch 2.5 现已支持 Intel GPU 博客 PyTorch 2.5 现已支持英特尔 GPU PyTorch® 2.5 现已支持 Intel GPU,提供改进的功能和性能……Intel PyTorch 团队2024年10月25日
ExecuTorch Beta:设备端 AI 和 LLM、稳定性以及与合作伙伴的加速 博客 ExecuTorch Beta:设备端 AI 和 LLM、稳定性以及与合作伙伴的加速 ExecuTorch 随着 v0.4 版本的发布已达到 Beta 阶段,提供了稳定的 API 和运行时……PyTorch 基金会2024年10月24日
TorchRec 和 FBGEMM 1.0 稳定版发布 博客 TorchRec 和 FBGEMM 1.0 稳定版发布 我们很高兴地宣布 TorchRec 和 FBGEMM 的 1.0 稳定版发布。TorchRec 是 PyTorch 原生……Paul Zhang、Zain Huda、Sarunya Pumma、Shintaro Iwasaki、Supadchaya Puangpontip、Benson Ma2024年10月23日
在 Windows CPU 上实现 PyTorch 性能提升的路径 博客 在 Windows CPU 上实现 PyTorch 性能提升的路径 PyTorch 在 Windows 上 CPU 性能低于 Linux 的挑战一直是一个……英特尔公司2024年10月15日
PyTorch 基金会技术咨询委员会选举新领导层 博客 PyTorch 基金会技术咨询委员会选举新领导层 我们很高兴地宣布 PyTorch 基金会首任主席和副主席……PyTorch 基金会2024年10月8日
2024 PyTorch 大会回顾:如火如荼 🔥 博客 2024 年 PyTorch 大会回顾:如火如荼 🔥 2024 年旧金山 PyTorch 大会汇集了近 1,500 名 AI 研究人员、开发者和爱好者……Jennifer Bly, PyTorch 基金会2024年10月2日
PyTorch 多设备集成中的挑战与努力:兼容性、可移植性和集成效率 博客 PyTorch 多设备集成中的挑战与努力:兼容性、可移植性和集成效率 引言:随着对各种硬件加速器需求的增长,对一个强大且……宗泽生(华为),李家玮(华为)| 共同作者:宫炯(英特尔),Bartosz Sochacki(英特尔),王益康(英特尔)2024年9月18日
LLM 的无 CUDA 推理 博客 无需 CUDA 的 LLM 推理 在这篇博客中,我们讨论了如何使用流行的模型实现 FP16 推理……Adnan Hoque、Less Wright、Raghu Ganti 和 Mudhakar Srivatsa2024年9月4日
加速您的 AI:PyTorch 2.4 现已支持 Intel GPU,实现更快的负载 博客 加速您的 AI:PyTorch 2.4 现已支持英特尔 GPU,实现更快的工作负载 我们有好消息!PyTorch 2.4 现已支持 Intel® 数据中心 GPU Max 系列和……英特尔 PyTorch 团队2024年8月29日
在 Opacus 中实现快速梯度裁剪和幽灵裁剪 博客 在 Opacus 中启用快速梯度裁剪和幽灵裁剪 引言与背景 差分隐私随机梯度下降(DP-SGD)是训练机器学习的规范方法……Enayat Ullah、Huanyu Zhang、Will Bullock、Ilya Mironov2024年8月20日
FlexAttention:PyTorch 的灵活性与 FlashAttention 的性能 博客 FlexAttention:PyTorch 的灵活性与 FlashAttention 的性能 理论上,Attention 是你所需要的一切。然而,在实践中,我们还需要优化的 Attention……PyTorch 团队:Driss Guessous、Yanbo Liang、Joy Dong、Horace He2024年8月7日
使用 PyTorch 对大型语言模型进行量化感知训练 博客 使用 PyTorch 对大型语言模型进行量化感知训练 在这篇博客中,我们展示了大型语言模型的端到端量化感知训练 (QAT) 流程……Andrew Or、Jerry Zhang、Evan Smothers、Kartikay Khandelwal、Supriya Rao2024年7月30日
PyTorch 2.4 发布博客 博客 PyTorch 2.4 发布博客 我们很高兴地宣布 PyTorch® 2.4(发行说明)发布!PyTorch 2.4 增加了……PyTorch 基金会2024年7月24日
深入探讨 Hopper TMA 单元的 FP8 GEMMs 博客 深入探讨 Hopper TMA 单元在 FP8 GEMM 中的应用 摘要 Hopper (H100) GPU 架构被誉为“第一个真正的异步 GPU”,包含一个……Adnan Hoque、Less Wright、Chih-Chieh Yang2024年7月22日
FlashAttention-3:基于异步和低精度实现快速准确的注意力机制 博客 FlashAttention-3:通过异步和低精度实现快速准确的注意力机制 注意力机制作为无处不在的 Transformer 架构的核心层,是大型模型的一个瓶颈……Jay Shah 和 Ganesh Bikshandi (Colfax Research),Ying Zhang (Meta),Vijay Thakkar 和 Pradeep Ramani (NVIDIA),Tri Dao (TogetherAI 和 普林斯顿大学)2024年7月11日
了解如何使用 ExecuTorch 和 Llama 模型开发 Android 应用程序 博客 学习如何使用 ExecuTorch 和 Llama 模型开发 Android 应用程序 此博客由 Arm 的 PyTorch 团队提供。更多详情请见此处……Arm2024年7月10日
在 AWS Graviton 处理器上使用 torch.compile 加速 PyTorch 推理 博客 使用 AWS Graviton 处理器上的 torch.compile 加速 PyTorch 推理 摘要 最初,PyTorch 使用一种即时模式,其中构成模型的每个 PyTorch 操作……Sunita Nadampalli2024年7月9日