2025 年 1 月 24 日
英特尔如何使用 PyTorch 通过 Intel Arc GPU 为生成式 AI 赋能
长期以来,英特尔一直走在技术创新的前沿,其近期进军生成式 AI (GenAI) 解决方案领域也不例外。随着 AI 驱动的游戏体验的兴起,英特尔力求交付一种可访问且直观的 GenAI 推理解决方案,该解决方案专为由英特尔最新 GPU 驱动的 AI PC 量身定制。通过利用 PyTorch 作为开发工作的支柱,英特尔成功推出了 AI Playground,这是一个展示高级 GenAI 工作负载的开源应用程序。
2024 年 9 月 27 日
使用 PyTorch 进行单目深度估计网络研讨会
在本网络研讨会中,英特尔的 Bob Chesebrough 将指导您完成他创建剪裁图像的步骤,该图像的背景杂乱已被移除。他使用 PyTorch 的单目深度估计完成了这项工作。这可能用于自动化运动结构和其他图像相关任务,在这些任务中,您希望突出显示或聚焦图像的单个部分,特别是用于识别图像中离相机最近的部分。具体来说,他使用了深度估计...
2024 年 5 月 25 日
AI 帮助 Duolingo 个性化语言学习
学习外语可能是您去年的目标之一。还有前年,以及前前年。就像健身房会员资格一样,我们最好的意图通常无法持续太久。除了掌握一门新语言所需的时间外,大多数人在传统学习方法上都举步维艰。即使是许多基于网络的语言工具也可能单调乏味且笨重。
2023 年 10 月 11 日
ML 模型服务器资源节省 - 从高成本 GPU 过渡到英特尔 CPU 和 oneAPI 驱动的软件,并保持性能
在此,我们将分享我们把 AI 工作负载从 GPU 服务器迁移到英特尔 CPU 服务器的经验,此过程没有任何性能或质量下降,并且在此过程中每年节省了大约 34 万美元的成本(请参阅结论)。
2023 年 3 月 9 日
Axon 通过 Azure 上的车载自动车牌识别技术为公共安全提供技术助力
公共安全技术领导者 Axon 开发了 AI 技术,为其车载摄像头产品添加了尖端的车牌识别功能,现在可以识别感兴趣车辆的车牌,并为执法部门提供主动通知和警报。Axon AI 科学家和工程师选择 Microsoft Azure 基础设施作为可扩展、经济高效且功能丰富的环境,他们可以在其中开发和测试 AI 模型。借助 Azure 计算、存储和 PyTorch a...
2023 年 2 月 21 日
HippoScreen 使用 oneAPI 工具将 AI 性能提升 2.4 倍
这家总部位于台湾的神经技术初创公司使用了 Intel® oneAPI Base 和 AI Analytics Toolkits 中的工具和框架,以提高其 Brain Waves AI 系统中使用的深度学习模型的效率和构建时间。因此,HippoScreen 能够将其系统的应用扩展到更广泛的精神疾病和病症。
2023 年 2 月 2 日
NASA 和 IBM 将通过新的基础模型加速 AI 创建
NASA 和 IBM 正在合作创建基于 NASA 数据集(包括地理空间数据)的基础模型,目标是加速 AI 模型的创建。
2023 年 1 月 23 日
使用 PyTorch 和 TorchServe 的搜索模型服务
Walmart Search 已开始在搜索生态系统中采用深度学习的旅程,以提高搜索相关性。对于我们的试点用例,我们在运行时为计算密集型 Bert Base 模型提供服务,目标是实现低延迟和高吞吐量。
2022 年 12 月 30 日
使用 Azure 机器学习的联邦学习从孤立的医疗保健数据中提取价值
医疗保健数据等敏感信息通常被隔离在医疗机构边界内。这对医疗保健和生命科学行业使用的机器学习模型提出了挑战,这些模型需要数据进行训练。为了改善患者护理并加速医疗保健行业的进步,Microsoft Health & Life Sciences AI 团队使用联邦学习设置来训练其生物医学自然语言处理服务 Text Analytics for Health,同时保护...
2022 年 12 月 2 日
PyTorch 如何将 AI 的强大功能带入计算机和智能手机
人们在 Facebook 和 Instagram 上享受的许多体验都由人工智能 (AI) 驱动。其中许多体验(如 Assistant、Avatars 和 AR 效果)无法由服务器端 AI 驱动,原因是延迟、网络带宽和其他限制。在设备上(即直接在手机、平板电脑,甚至是一副智能眼镜上)运行 AI 比不断将数据发送回服务器具有巨大优势。它速度更快,并为人们创造了增强隐私的体验,因为...
2022 年 11 月 17 日
IBM Research:将大规模 AI 模型引入任何云
AI 领域正处于一场革命之中。近年来,AI 模型已经能够根据简单的文本提示制作图像、歌曲甚至网站。这些具有数十亿参数的模型(称为基础模型)只需稍加微调即可从一项任务重新用于另一项任务,从而节省了无数的训练和标记时间,并将模型重新调整以承担新任务。
2022 年 10 月 25 日
使用 Amazon EKS 大规模运行 OpenFold 的推理,这是一个基于 PyTorch 的蛋白质折叠 ML 模型
在药物发现中,了解蛋白质的 3D 结构是评估药物与其结合能力的关键,这直接影响其功效。然而,预测 3D 蛋白质形式非常复杂、具有挑战性、成本高昂且耗时,并且在使用 X 射线衍射等传统方法时可能需要数年时间。应用机器学习 (ML) 来预测这些结构可以显著加快预测蛋白质结构的时间——从数年缩短到数小时。一些高调的...
2022 年 10 月 4 日
使用 AWS Batch 优化 OpenFold 的蛋白质折叠成本
了解蛋白质的物理结构是药物发现过程的重要组成部分。AlphaFold v2.0 等机器学习 (ML) 算法显著降低了生成可用蛋白质结构所需的成本和时间。这些项目还启发了用于从头蛋白质设计和蛋白质-配体相互作用分析的 AI 驱动工作流的开发。
2022 年 6 月 28 日
Crayon 使用 Azure 机器学习和 PyTorch 提高医疗保健审计流程的速度和准确性
医疗保健提供商需要能够验证他们是否保持最高的运营安全和效率标准。这些标准由国家认证组织设定,该组织的检查员(通常是医疗保健专业人员)定期访问设施并记录可能需要纠正或恢复到最新规则和政策的情况。评估和认证过程产生大量数据,即使是最有经验的...
2022 年 5 月 25 日
Wayve 的 AV2.0 通过 Azure 机器学习和 PyTorch 构建更光明的未来
Wayve 希望通过使用基于视觉的机器学习进行快速原型设计和快速迭代,加速和扩展自动驾驶汽车 (AV) 的开发。因此,它开发了一个平台,该平台使用开源机器学习框架 PyTorch 和 Microsoft Azure 机器学习,以收集、管理和处理每年数百万小时的驾驶数据(PB 级数据),其中包括图像、GPS 数据和来自其他传感器的数据。Wayve 现在拥有可扩展的容量来构建和迭代驾驶...
2022 年 5 月 12 日
环境临床智能:使用 PyTorch 生成医疗报告
完整而准确的临床文档是跟踪患者护理的重要工具。它允许在护理团队之间共享治疗计划,以帮助护理的连续性,并确保透明有效的报销流程。
2022 年 3 月 16 日
Bentley Systems 创建突破性框架,使用 Azure 机器学习大幅加速 AI 开发
软件创新者 Bentley Systems 提供广泛的解决方案组合,以帮助设计、构建和运营世界基础设施资产的组织。该公司在其旗舰产品中使用机器学习来读取不同的纸质资产数据,并将其转换为整合的数字数据。为了加速和规范化此过程,Bentley 使用 Microsoft Azure 机器学习和 PyTorch 创建了一个机器学习运营框架。开发人员的速度和工作满意度...
2022 年 3 月 14 日
Solliance 通过由 Azure 机器学习和 PyTorch 驱动的加密货币新闻分析平台成为头条新闻
Solliance 提供尖端解决方案,以填补各行各业的空白。通过最近与 Baseline 的合作,Solliance 彻底改变了加密货币交易体验,近乎实时地从 15 万多个全球来源提取新闻见解。为了管理 Baseline 工作负载,Solliance 将 Microsoft Azure 机器学习和 PyTorch 结合在一起,以实现最大的处理能力和深度学习能力。结果:投资者可以深入了解头条新闻...
2022 年 3 月 2 日
在 AWS 上使用 NLP 创建葡萄酒推荐器
在本教程中,我们将构建一个简单的机器学习管道,使用 BERT 词嵌入模型和最近邻算法,根据用户输入的偏好推荐葡萄酒。为了创建和驱动此推荐引擎,我们将利用 AWS 的 SageMaker 平台,该平台为我们提供了一种完全托管的方式来训练和部署我们的服务。
2022 年 2 月 24 日
Amazon Ads 使用 PyTorch 和 AWS Inferentia 来扩展广告处理模型
Amazon Ads 使用 PyTorch、TorchServe 和 AWS Inferentia 将推理成本降低 71%,并推动规模扩展。Amazon Ads 帮助公司建立品牌,并通过在亚马逊商店内外(包括网站、应用程序和 15 个以上国家/地区的流媒体电视内容)展示的广告与购物者建立联系。各种规模的企业和品牌,包括注册卖家、供应商、图书供应商、Kindle Direct Publishing (KDP) 作者、应用程序开发人员和代理商,都可以上传自己的广告...
2022 年 2 月 10 日
ChemicalX:用于药物对评分的深度学习库
在本文中,我们介绍了 ChemicalX,这是一个基于 PyTorch 的深度学习库,旨在提供一系列最先进的模型来解决药物对评分任务。该库的主要目标是使机器学习研究人员和从业人员能够以简化的方式访问深度药物对评分模型,网址为 this http URL ChemicalX 的设计重用了来自 PyTorch 生态系统的现有高级模型训练实用程序、几何深度学习和深度化学层。我们的...
2022 年 1 月 4 日
扩展大型语言模型的理由和方法
Anthropic 是一家 AI 安全和研究公司,致力于构建可靠、可解释和可操纵的 AI 系统。在过去的十年中,用于最大规模训练运行的计算量呈指数级增长。我们还在许多领域看到,更大的模型能够根据精确的扩展定律获得更好的性能。训练这些模型所需的计算只能通过许多协调的机器来实现,这些机器之间正在通信数据。我...
2021 年 11 月 21 日
在 AWS Inf1 上运行 BERT 模型推理:从模型编译到速度比较
在这篇技术博客中,我们将比较 Inferentia、GPU 和 CPU 在 BERT 序列标记示例中的速度和成本。我们还提供了一个有用的教程,介绍在 Inf1 实例上进行模型编译和推理的步骤。
2021 年 11 月 9 日
SearchSage:在 Pinterest 学习搜索查询表示
Pinterest 每天向人们展示数十亿个想法,内容、用户和搜索查询的嵌入神经建模是不断改进这些机器学习驱动的推荐的关键。良好的嵌入(将离散实体表示为数字向量)可以实现快速候选生成,并且是模型分类、检索和排名相关内容的强大信号。
2021 年 10 月 18 日
我们是如何构建的:早期推荐系统
个性化如今在大多数平台上无处不在。在连接性的推动和机器学习的扩展下,互联网上的大多数体验都根据我们的个人品味量身定制。Peloton 课程提供各种各样的教练、语言、健身学科、时长和强度。每位会员都有特定的健身目标、时间表、健身器材以及技能或力量水平。内容的多样性和会员需求的个性化(大规模)为...
2021 年 9 月 7 日
在 Cisco Webex Assistant 中使用字素到音素模型
字素到音素 (G2P) 是一种根据单词的书写形式(字素)生成发音(音素)的功能。它在自动语音识别系统、自然语言处理和文本到语音引擎中发挥着重要作用。在 Cisco Webex Assistant 中,我们使用 G2P 建模来帮助从语音中解析人名。请参阅此处,了解我们用于构建稳健的语音助手的各种技术的更多详细信息。
2021 年 9 月 7 日
AI 如何帮助兽医帮助我们的宠物
四分之一的狗和五分之一的猫在一生中的某个时候会患上癌症。得益于早期识别、诊断和治疗方面的进步,如今宠物的成功治疗机会比以往任何时候都更高。
2021 年 8 月 10 日
佩奇大学支持匈牙利语的文本和语音处理,仅用 1000 欧元和 Azure 构建了 BERT-large 模型
每个人都喜欢在与聊天代理和其他自动化服务交流时使用母语。但是,对于像匈牙利语这样的小语种(只有 1500 万人使用),市场规模通常被认为太小,不足以让大公司创建可以处理匈牙利语文本作为输入的软件、工具或应用程序。佩奇大学的应用数据科学和人工智能团队认识到这种需求,决定挺身而出。使用 Microsoft AI 解决方案和 ONNX...
2021 年 6 月 17 日
3DFY.ai 如何使用 TorchElastic 和 Kubernetes 在 Spot 实例上构建多云分布式训练平台
深度学习开发越来越关注最大限度地缩短从想法到训练模型的时长。为了缩短此交付周期,研究人员需要访问一个训练环境,该环境支持同时运行多个实验,每个实验都利用多个 GPU。
2021 年 6 月 7 日
AI21 Labs 使用 Amazon EC2 P4d 实例和 PyTorch 训练 1780 亿参数的语言模型
AI21 Labs 使用机器学习来开发专注于理解含义的语言模型,并在 2021 年设定了一个目标,即训练最近发布的 Jurassic-1 Jumbo,这是一个具有 1780 亿个参数的自回归语言模型。注册进行 Beta 测试的开发人员将获得访问 Jurassic-1 Jumbo 的权限,并且可以立即开始为其用例自定义模型。这家软件初创公司希望高效地训练模型,因此它求助于 Amazon Web Services (AWS) 并构建了一个解决方案...
2021 年 6 月 2 日
PyTorch 社区之声
加入我们,参加对来自 AutoDesk 的明星 PyTorch 社区成员 Alexander O’Connor 和 Binghui Ouyang 的采访,了解他们如何使用 PyTorch 和 AWS Inferentia 在聊天机器人意图分类中部署生产规模模型。
2021 年 5 月 14 日
Outreach 如何将基于 PyTorch 的 Hugging Face Transformers 投入生产以用于 NLP
在领先的销售互动平台 Outreach,我们的数据科学团队是我们创新产品组合背后的驱动力,这些产品组合主要由深度学习和 AI 驱动。我们最近宣布增强 Outreach Insights 功能,该功能由 Outreach 数据科学团队开发的专有买家情绪深度学习模型提供支持。该模型使销售团队能够通过分析电子邮件回复内容来加深对客户情绪的理解,从而从 j...
2021 年 4 月 29 日
使用 Databricks 上的 PyTorch 在电子商务时尚图像处理中自动去除背景
Wehkamp 是荷兰最大的电子商务公司之一,其网站每天的访问量超过 50 万。Wehkamp 网站上提供的各种各样的产品旨在满足客户的许多需求。电子商务网站上任何客户访问的一个重要方面是产品的优质且准确的视觉体验。大规模而言,这不是一件容易的任务,当地照相馆处理了数千张产品照片。
2021 年 4 月 27 日
Disney 的创意基因组,作者:Miquel Farré
Miquel Farré 是迪士尼的高级技术经理,领导视频技术、机器学习和 Web 应用程序交叉领域的项目。驱动内容可搜索性的元数据最常在标题级别进行索引,治理有限且歧义性高;最好的情况是,关键字元数据已添加到标题中作为富集层。
2021 年 4 月 7 日
我们如何使用 AWS Inferentia 将 Autodesk Ava 聊天机器人的 PyTorch NLP 模型性能提升 4.9 倍
Autodesk 是一家跨国软件公司,其世界闻名的产品涉及建筑、工程与建造、制造以及媒体与娱乐等领域。Autodesk 最著名的产品包括 AutoCAD、Revit、Maya 和 Fusion 360。该公司在全球拥有数百万客户,其中许多客户需要支持才能充分利用其产品。
2021 年 2 月 25 日
Tubi 的机器学习:为所有人提供免费电影、电视和新闻
在本博客系列中,我们的目标是重点介绍 Tubi 的广告支持视频点播 (AVOD) 领域中机器学习的细微差别。机器学习有助于解决涉及推荐、内容理解和广告的无数问题。我们广泛使用 PyTorch 来处理其中的几个用例,因为它为我们提供了灵活性、计算速度和易于实现的特点,从而可以使用 GPU 训练大规模深度神经网络。
2021 年 1 月 27 日
deepset 通过与 AWS 和 NVIDIA 合作,将 NLP 模型训练的速度提高 3.9 倍,成本降低 12.8 倍
在 deepset,我们正在为商业文档构建下一代搜索引擎。我们的核心产品 Haystack 是一个开源框架,使开发人员能够利用最新的 NLP 模型进行大规模语义搜索和问题解答。我们的软件即服务 (SaaS) 平台 Haystack Hub 被来自金融、法律和汽车等各个行业的开发人员使用,以查找各种文本文档中的答案。您可以使用这些答案来改善搜索体验...
2020 年 12 月 17 日
theator 如何构建持续训练框架来扩展其外科智能平台
进行手术在很大程度上是关于决策制定。正如 Frank Spencer 博士在 1978 年所说,“一个熟练的手术大约 75% 是决策制定,25% 是灵巧性”。五十年后,外科领域终于(尽管是逐步地)实施了数据科学和 AI 方面的进步,以增强外科医生在手术室中做出最佳决策的能力。这就是 theator 的用武之地:该公司正在通过外科智能平台重新构想外科手术,该平台利用高度...
2020 年 12 月 2 日
PyTorch JIT 中的图卷积运算符
在本次演讲中,科学家 Lindsey Gray 和博士生 Matthias Fey 共同探讨了高能粒子物理学的挑战如何推动对神经网络开发中更高效的研发管道的需求。特别是,他们研究了对 PyTorch Geometric 所做的补充,这些补充允许 PyTorch JIT 编译图神经网络模型,从而显著简化了大规模部署此类网络的过程。
2020 年 10 月 22 日
Wadhwani AI 如何使用 PyTorch 为棉农赋能
棉花是世界各地主要的纤维作物,在 80 多个国家/地区种植,全球近 1 亿个家庭依靠棉花种植为生。由于许多农民的作物都非常重要,因此棉花特别容易受到虫害困扰,这让许多人感到不安。然而,虫害同时也是农民面临的最重要和最可预防的问题之一,印度所有农药使用量的 55% 都用于棉花种植...
2020 年 10 月 7 日
Lyft 如何使用 PyTorch 为其自动驾驶汽车提供机器学习动力
Lyft 的使命是通过世界上最好的交通工具来改善人们的生活。我们相信,在未来,自动驾驶汽车将使交通更安全、更便捷。这就是 Lyft 的自动驾驶部门 Level 5 正在为 Lyft 网络开发完整的自动驾驶系统的原因,以便让乘客能够获得这项技术的好处。然而,这是一项极其复杂的任务。
2020 年 9 月 30 日
使用先进的机器学习加速药物发现
无论我们在 AstraZeneca 的职位头衔是什么,我们都是探索者。我是生物学见解知识图谱 (BIKG) 团队的成员。我们帮助科学家梳理海量数据,以找到我们需要的信息,从而帮助我们交付改变生命的药物。
2020 年 9 月 30 日
AstraZeneca 正在使用 PyTorch 驱动的算法来发现新药
自 2017 年推出以来,Facebook 的机器学习框架 PyTorch 已得到良好应用,应用范围从为 Elon Musk 的自动驾驶汽车提供动力到推动机器人农业项目。现在,制药公司 AstraZeneca 透露了其内部工程师团队也在如何使用 PyTorch,并且是为了同样重要的事业:简化和加速药物发现。
2020 年 8 月 6 日
农业 AI:用于农业的生产机器学习
农业是如何影响您今天的?如果您住在城市里,您可能会觉得自己与生产食物的农场和土地脱节了。农业是我们生活的核心组成部分,但我们常常认为这是理所当然的。
2020 年 7 月 17 日
Pixar 如何使用 AI 和 GAN 来创建高分辨率内容
随着数字动画师不断突破技术和创造力的界限,支持他们的技术团队正在转向人工智能和机器学习,以交付他们所需的工具。Pixar 就是这种情况,该公司取得了新的机器学习突破,希望这些突破既能提高质量又能降低成本。
2020 年 7 月 16 日
迪士尼如何使用 PyTorch 进行动画角色识别
媒体行业的长期渐进式发展,从传统的广播和家庭视频模式,到数字可访问内容日益增多的混合模式,加速了机器学习和人工智能 (AI) 的使用。推进这些技术的实施对于像迪士尼这样拥有近百年内容制作历史的公司至关重要,因为它允许新的消费者体验,并为插画家和作家启用新的应用程序,以创作...
2020 年 6 月 16 日
Trigo 如何构建可扩展的 AI 开发和部署管道,实现无摩擦零售
Trigo 是一家为零售市场提供基于 AI 和计算机视觉的免结账系统的供应商,可实现无摩擦结账以及一系列其他店内运营和营销解决方案,例如预测性库存管理、安全和欺诈预防、定价优化和事件驱动型营销。
2020 年 6 月 9 日
Datarock 如何使用 PyTorch 进行更智能的采矿决策
采矿业目前正在经历一场数字化革命,因为它正在寻找新的创新方法来勘探和开采矿产资源。这主要是由于全球竞争激烈的行业需要降低成本,该行业正面临矿石品位下降和新发现减少的问题。
2020 年 4 月 25 日
使用 pytorch/serve 将 huggingface 的 BERT 部署到生产环境
TL;DR: pytorch/serve 是一个新的很棒的框架,用于在生产环境中服务 torch 模型。这个故事教你如何将其用于 huggingface/transformers 模型,如 BERT。
2019 年 11 月 14 日
使用深度学习和 PyTorch 为加州理工学院的下一代飞机提供动力
了解加州理工学院的自主系统和技术中心 (CAST) 如何使用 PyTorch 构建深度学习系统,这些系统可以理解飞机与地面相互作用的空气动力学原理,从而实现更平稳和安全的着陆。
2019 年 11 月 6 日
Dolby Labs 的 PyTorch
了解 Dolby Labs 如何使用 PyTorch 开发用于音频的深度学习,并了解音频 AI 带来的挑战,以及他们在 Dolby 构建的突破和应用,以推动该领域向前发展。
2019 年 8 月 20 日
Airbnb 客户服务的对话协助
企业正在使用开源机器学习框架 PyTorch,在其产品和服务中无缝构建、训练和部署生产环境中的 AI 模型。了解行业领导者如何利用 PyTorch 来帮助驱动从全球通用的生产力软件到推动医学进步以对抗癌症的一切。
2019 年 7 月 23 日
Mapillary Research:无缝场景分割和就地激活 BatchNorm
由于像美国这样的发达国家的道路每年变化高达 15%,Mapillary 通过将任何摄像机的图像组合成世界的 3D 可视化,来满足不断增长的地图更新需求。Mapillary 的独立和协作方法使任何人都可以收集、共享和使用街景图像,以改进地图、发展城市和推动汽车行业发展。