PyTorch/XLA 2.7 发布:可用性、vLLM 增强、JAX 桥接、GPU 构建 博客 PyTorch/XLA 2.7 版本发布:可用性、vLLM 增强、JAX 桥接、GPU 构建 PyTorch/XLA 是一个 Python 包,它使用 XLA 深度学习编译器来支持 PyTorch…Pei Zhang, Chris Jones2025 年 5 月 13 日
MetaShuffling:加速 Llama 4 MoE 推理 博客 MetaShuffling:加速 Llama 4 MoE 推理 混合专家(MoE)是大型语言模型(LLM)中一种流行的模型架构。尽管它减少了…Shikai Li, Gefei Zuo, Jianyu Huang, Jason Park, Zoey Sun, Xiaozhu Meng, Xiaodong Wang, Hongtao Yu, Changkyu Kim, CQ Tang, Stephen Chen2025 年 5 月 12 日
PyTorch:人工智能的开放语言 博客 PyTorch:人工智能的开放语言 核心要点:如今,PyTorch 为生成式人工智能世界提供动力,Meta 等主要人工智能参与者都使用…Joe Spisak (Meta), Luca Antiga (Lightning.AI)2025 年 5 月 7 日
PyTorch 韩国用户组聚会回顾:与 PyTorch 核心维护者共同举办的技术会议 博客 PyTorch 韩国用户组 Meetup 回顾:与 PyTorch 核心维护者共同举办的技术会议 三月底,PyTorch 韩国用户组举办了一次特别聚会,该聚会…Jiho Kim, PyTorch 韩国用户组2025 年 5 月 5 日
FlexAttention 第二部分:用于推理的 FlexAttention 博客 FlexAttention 第二部分:用于推理的 FlexAttention 概述 在 PyTorch 2.5.0 版本中,我们为希望…的机器学习研究人员引入了 FlexAttention torch.nn.attention.flex_attentionJoy Dong, Boyuan Feng, Driss Guessous, Joel Schlosser, Yanbo Liang, Horace He2025 年 4 月 30 日
PyTorch 中速度提升 6 倍的异步检查点:使用缓存计划,无 GIL 争用 博客 PyTorch 异步检查点速度提升 6 倍,使用缓存计划,无 GIL 争用 Meta:Less Wright、Meet Vadakkanchery、Saurabh Mishra、Ela Krepska、Hamid Shojanazeri、Pradeep Fernando Crusoe:Ethan…Meta and Crusoe2025 年 4 月 30 日
在 Crusoe 2K H200s 上使用 PyTorch Float8 Rowwise 加速大规模训练和收敛 博客 在 Crusoe 2K H200s 上使用 PyTorch Float8 Rowwise 加速大规模训练和收敛 Meta:Less Wright、Hamid Shojanazeri、Vasiliy Kuznetsov、Daniel Vega-Myhre、Gokul Nadathur、Will Constable、Tianyu Liu…Meta and Crusoe2025 年 4 月 28 日
在英特尔® GPU 上加速 PyTorch 2.7 博客 在英特尔® GPU 上加速 PyTorch 2.7 PyTorch 2.7 继续在英特尔® GPU 架构上提供重要的功能和性能增强,以简化…英特尔 PyTorch 团队2025 年 4 月 25 日
使用 PyTorch 和 Hugging Face Transformers 在 Arm 上加速 Whisper 博客 使用 PyTorch 和 Hugging Face Transformers 在 Arm 上加速 Whisper 自动语音识别(ASR)彻底改变了我们与技术互动的方式,为…开辟了道路。Pareena Verma, Arm2025 年 4 月 8 日
SGLang 加入 PyTorch 生态系统:高效的 LLM 服务引擎 社区 SGLang 加入 PyTorch 生态系统:高效的 LLM 服务引擎 我们很高兴地宣布,SGLang 项目已集成到 PyTorch 生态系统中!…SGLang 团队2025 年 3 月 19 日
2025 年 PyTorch 中国开发者大会提案征集开放 博客 2025 年 PyTorch 中国开发者大会议题征集开始 我们很高兴地宣布首届 PyTorch 中国开发者大会!这个由 PyTorch 基金会主办的新活动,…PyTorch 基金会2025 年 3 月 19 日
PyTorch 亮相 GTC 2025 社区 PyTorch 亮相 GTC 2025 GTC 将于 2025 年 3 月 17-21 日重返圣何塞。加入 PyTorch 基金会成员 Arm,…PyTorch 基金会2025 年 3 月 16 日
通过 2D 稀疏并行将推荐系统训练扩展到数千个 GPU 博客 使用 2D 稀疏并行将推荐系统训练扩展到数千个 GPU 在 Meta,推荐系统是向数十亿用户提供相关和个性化广告的基石…Meta PyTorch 团队:Chunzhi Yang, Rich Zhu, Zain Huda, Liangbei Xu, Xin Zhang, Jiyan Yang, Dennis van der Staay, Wang Zhou, Jin Fang, Jade Nie, Yuxi Hu2025 年 3 月 11 日
利用 PyTorch、Fedora 和开源社区赋能人工智能 社区 利用 PyTorch、Fedora 和开源社区赋能人工智能 在浦那举行的 DevConf.IN 2025 上,我有机会在 2 月 28 日主办了一场 PyTorch 聚会。该会议…Sudhir Dharanendraiah2025 年 3 月 7 日
峰值性能,最小化内存:使用 torch.compile 和 Liger 内核优化 torchtune 的性能 博客 巅峰性能,最小化内存:使用 torch.compile 和 Liger Kernel 优化 torchtune 的性能 LinkedIn:Shivam Sahni, Byron Hsu, Yanning ChenMeta:Ankith Gunapal, Evan Smothers 这篇博客探讨了…LinkedIn and Meta2025 年 3 月 6 日
PyTorch 中当前和新的激活检查点技术 博客 PyTorch 中现有及全新的激活检查点技术 随着模型在深度、批量大小和序列长度等方面的扩展,激活内存成为一个…PyTorch 基金会2025 年 3 月 5 日
使用 PyTorch 加速生成式 AI:Segment Anything 2 – 低延迟和快速冷启动下的极速推理 博客 使用 PyTorch 加速生成式 AI:Segment Anything 2 – 以低延迟和快速冷启动实现极速推理 这篇文章是我们多系列博客中第一篇的后续,该系列专注于如何…PyTorch 基金会2025 年 2 月 26 日
解锁 PyTorch 2.6 在英特尔平台上的最新功能 博客 解锁 PyTorch 2.6 在英特尔平台上的最新功能 PyTorch* 2.6 刚刚发布,带来了一系列令人兴奋的新功能,包括 torch.compile 兼容性…英特尔 PyTorch 团队2025 年 2 月 11 日