• 文档 >
  • TorchServe GenAI 用例与展示
快捷方式

TorchServe GenAI 用例与展示

本文档展示了 TorchServe 在 Gen AI 部署中的有趣用例。

使用 Torch Compiled RAG 在 AWS Graviton 上增强 LLM 服务

在此博客中,我们展示了如何使用 TorchServe 部署 RAG 端点,如何使用 torch.compile 提高吞吐量,以及如何改进 Llama 端点生成的响应。我们还展示了如何在 CPU 上使用 AWS Graviton 部署 RAG 端点,而 Llama 端点仍部署在 GPU 上。这种基于微服务的 RAG 解决方案有效地利用了计算资源,从而为客户节省了潜在的成本。

多图像生成 Streamlit 应用程序:使用 TorchServe、torch.compile 和 OpenVINO 链接 Llama 和 Stable Diffusion

此多图像生成 Streamlit 应用程序旨在根据提供的文本提示生成多张图像。此应用程序没有直接使用 Stable Diffusion,而是链接 Llama 和 Stable Diffusion 来增强图像生成过程。这种多图像生成用例体现了前沿 AI 技术的强大协同作用:TorchServe、OpenVINO、Torch.compile、Meta-Llama 和 Stable Diffusion。


© 版权所有 2020,PyTorch Serve 贡献者。

使用 Sphinx 构建,主题由 theme 提供,Read the Docs 提供支持。

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取面向初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获得问题解答

查看资源