了解 TPU¶
Google Cloud TPU 是定制设计的 AI 加速器,针对大型 AI 模型的训练和推理进行了优化。它们非常适合各种用例,例如聊天机器人、代码生成、媒体内容生成、合成语音、视觉服务、推荐引擎、个性化模型等。
Cloud TPU 旨在经济高效地扩展以适应各种 AI 工作负载,涵盖训练、微调和推理。Cloud TPU 提供了加速领先 AI 框架(包括 PyTorch、JAX 和 TensorFlow)上工作负载的多功能性。通过 Google Kubernetes Engine (GKE) 中 Cloud TPU 的集成,无缝编排大规模 AI 工作负载。利用动态工作负载调度器,通过同时调度所有需要的加速器来提高工作负载的可扩展性。寻求开发 AI 模型最简单方法的客户还可以利用 Vertex AI 中的 Cloud TPU,这是一个完全托管的 AI 平台。
更多信息,请参阅