快捷方式

请求包络

许多模型服务系统都为请求体提供了签名。例如:

数据科学家使用这些多框架系统来管理许多不同模型的部署,这些模型可能使用不同的语言和框架编写。这些平台在模型服务之上提供了额外的分析,包括偏差检测、解释和 A/B 测试。这些平台需要一个结构良好的签名,以便跨不同框架标准化调用并理解输入数据。但是,为了简化对许多框架的支持,这些平台会将请求体直接传递给底层模型服务器。

Torchserve 目前没有固定的请求体签名。包络允许您自动从模型编排器所需的固定签名转换为扁平的 Python 列表。

用法

  1. 在编写处理程序时,始终期望一个包含准备传入 preprocess 的数据的普通 Python 列表。至关重要的是,您应该假设您的处理程序代码在本地或模型编排器中看起来相同。

  2. 在模型编排器后面部署 Torchserve 时,请确保在您的 config.properties 文件中设置相应的 service_envelope。例如,如果您使用的是 Google Cloud AI Platform(其格式为 JSON),则需要在您的 config.properties 文件中添加 service_envelope=json

贡献

ts/torch_handler/request_envelope 下添加新文件。每个文件只包含一个类。在 config.properties 中使用的键将是您编写类所在 .py 文件的名称。

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取针对初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获得问题的解答

查看资源