
机器学习 (ML) 的许多应用都带来了一系列安全和隐私挑战。特别是,用户可能不愿意或不允许共享其数据,这阻碍了他们充分利用 PyTorch 等 ML 平台。为了推动隐私保护机器学习 (PPML) 领域的发展,OpenMined 和 PyTorch 宣布计划联合开发一个组合平台,以加速 PPML 研究,并为奖学金提供新的资金。
有许多技术试图解决 ML 中的隐私问题,每种技术都处于不同的成熟度水平。这些包括 (1) 同态加密,(2) 安全多方计算,(3) 可信执行环境,(4) 设备上计算,(5) 具有安全聚合的联邦学习,以及 (6) 差分隐私。此外,还创建了许多实现这些技术的开源项目,旨在促进隐私、安全和 ML 交叉领域的研究。其中,PySyft 和 CrypTen 采用了“ML 优先”的方法,通过提供 ML 社区熟悉的 API,同时掩盖隐私和安全协议的复杂性。我们很高兴地宣布,这两个项目现在正在密切合作,围绕 PyTorch 构建一个成熟的 PPML 生态系统。
此外,为了壮大这个生态系统并推动隐私保护机器学习领域的发展,我们还呼吁为这个组合平台贡献力量并支持其研究工作,通过提供资金支持 OpenMined 社区和那些做出贡献、构建概念验证并渴望站在隐私保护技术应用前沿的研究人员。我们将通过 RAAIS 基金会提供资金,RAAIS 基金会是一个非营利组织,其使命是促进人工智能教育和研究,以造福公众。我们鼓励有兴趣的各方申请以下一项或多项奖学金。
推动隐私保护机器学习未来的工具
下一代隐私保护开源工具使 ML 研究人员能够轻松地使用安全计算技术试验 ML 模型,而无需成为密码学专家。通过与 PyTorch 集成,PySyft 和 CrypTen 为 ML 开发人员提供了熟悉的环境,以便在工作中研究和应用这些技术。
PySyft 是 OpenMined 社区开发的用于安全和隐私 ML 的 Python 库。它是一个灵活、易于使用的库,使多方计算 (MPC) 等安全计算技术和差分隐私等隐私保护技术可供 ML 社区使用。它优先考虑易用性,并专注于将这些技术集成到最终用户用例中,例如在手机和其他边缘设备上进行联邦学习、加密 ML 即服务以及隐私保护数据科学。
CrypTen 是一个基于 PyTorch 构建的框架,可为 PyTorch 社区实现私密和安全的 ML。它是 PyTorch 中实现隐私保护模式的第一步,该模式将使安全计算技术超越密码学研究人员的范围。它目前实现了 安全多方计算,目标是在不久的将来提供其他安全计算后端。ML 研究人员的其他好处包括:
- 它是ML 优先的,并通过 CrypTensor 对象呈现安全计算技术,该对象的外观和感觉与 PyTorch Tensor 完全相同。这允许用户使用自动微分和神经网络模块,类似于 PyTorch 中的模块。
- 该框架侧重于可扩展性和性能,并以现实世界中的挑战为导向进行构建。
CrypTen 和 PySyft 的重点领域自然一致且相互补充。前者专注于通过加密张量抽象在 PyTorch 上构建对各种安全和隐私保护技术的支持,而后者则专注于最终用户用例,例如在边缘设备上部署和用户友好的数据科学平台。
协同工作将使 PySyft 能够使用 CrypTen 作为加密张量的后端。这可以提高 PySyft 的性能,并促进 PySyft 用户群对 CrypTen 作为运行时的采用。除此之外,PyTorch 还添加了加密友好功能,例如支持加密安全随机数生成。从长远来看,这使得每个库都可以专注于其核心能力,同时享受协同关系带来的好处。
OpenMined 贡献者的新资金
我们特别高兴地宣布,PyTorch 团队已投资 25 万美元支持 OpenMined 进一步开发和推广隐私保护机器学习。这笔捐赠将通过 RAAIS 基金会促成,并将立即用于支持 OpenMined 社区的带薪研究金。
如何参与
感谢 PyTorch 团队的支持,OpenMined 能够为您提供三种不同的参与项目开发的机会。每项奖学金都进一步推动了我们共同的使命:降低隐私保护机器学习的门槛,并创建一个更加注重隐私的世界。
PySyft CrypTen 核心集成奖学金
在这些奖学金期间,我们将集成 CrypTen 作为 PySyft 中加密计算的受支持后端。这将允许 CrypTen 的高性能、安全多方计算能力与 PySyft 中其他重要工具(如差分隐私和联邦学习)一起使用。有关路线图和如何申请带薪奖学金的更多信息,请查看项目 的贡献者征集。
在移动、网络和物联网设备上进行联邦学习
在这些研究金期间,我们将扩展 PyTorch,使其能够在移动、网络和物联网设备上执行联邦学习。为此,PyTorch 前端将能够协调在 Javascript、Kotlin、Swift 和 Python 中运行的联邦学习后端。此外,我们还将扩展 PySyft,使其能够使用点对点连接协调这些后端,提供低延迟并能够作为协议的一部分运行安全聚合。有关路线图和如何申请带薪研究金的更多信息,请查看项目的贡献者征集。
开发挑战
在接下来的几个月里,我们将定期举办公开竞赛,以提高 PySyft 和 PyGrid 代码库的性能和安全性。在性能相关的挑战中,参赛者将(为现金奖励)竞争使特定的 PySyft 演示(例如联邦学习)尽可能快。在安全相关的挑战中,参赛者将竞争入侵 PyGrid 服务器。第一个展示其能力的人将赢得现金奖励!有关挑战的更多信息以及注册以在每个挑战开启时接收电子邮件,请在此注册。
要申请,请选择上述项目之一,并确定一个与您的优势相匹配的角色!
祝好,
安德鲁、劳伦斯、乔和舒博