• 文档 >
  • TorchServe GenAI 使用案例与展示
快捷方式

⚠️ 注意:有限维护

该项目不再积极维护。现有版本仍可使用,但没有计划中的更新、错误修复、新功能或安全补丁。用户应注意漏洞可能不会得到解决。

TorchServe GenAI 使用案例与展示

本文档展示了使用 TorchServe 进行 Gen AI 部署的一些有趣的使用案例。

在 AWS Graviton 上使用 Torch Compiled RAG 增强 LLM 服务

在这篇博客中,我们展示了如何使用 TorchServe 部署 RAG 端点,如何使用 torch.compile 提高吞吐量,以及如何改进 Llama 端点生成的响应。我们还展示了如何在 AWS Graviton 上使用 CPU 部署 RAG 端点,同时 Llama 端点仍然部署在 GPU 上。这种基于微服务的 RAG 解决方案有效利用计算资源,从而为客户带来潜在的成本节省。

多图生成 Streamlit 应用:使用 TorchServe、torch.compile 和 OpenVINO 串联 Llama 和 Stable Diffusion

这个多图生成 Streamlit 应用旨在根据提供的文本提示生成多张图片。该应用没有直接使用 Stable Diffusion,而是串联了 Llama 和 Stable Diffusion 来增强图片生成过程。这个多图生成的使用案例例证了尖端 AI 技术的强大协同效应:TorchServe、OpenVINO、Torch.compile、Meta-Llama 和 Stable Diffusion。


© 版权所有 2020,PyTorch Serve 贡献者。

使用 Sphinx 构建,主题由 Read the Docs 提供。

文档

访问 PyTorch 全面的开发者文档

查看文档

教程

获取面向初学者和高级开发者的深度教程

查看教程

资源

查找开发资源并获得问题解答

查看资源