请求包络¶
许多模型服务系统都为请求体提供了签名。例如:
数据科学家使用这些多框架系统来管理许多不同模型的部署,这些模型可能使用不同的语言和框架编写。这些平台在模型服务之上提供了额外的分析,包括偏差检测、解释和 A/B 测试。这些平台需要一个结构良好的签名,以便跨不同框架标准化调用并理解输入数据。但是,为了简化对许多框架的支持,这些平台会将请求体直接传递给底层模型服务器。
Torchserve 目前没有固定的请求体签名。包络允许您自动从模型编排器所需的固定签名转换为扁平的 Python 列表。
用法¶
在编写处理程序时,始终期望一个包含准备传入
preprocess
的数据的普通 Python 列表。至关重要的是,您应该假设您的处理程序代码在本地或模型编排器中看起来相同。在模型编排器后面部署 Torchserve 时,请确保在您的
config.properties
文件中设置相应的service_envelope
。例如,如果您使用的是 Google Cloud AI Platform(其格式为 JSON),则需要在您的config.properties
文件中添加service_envelope=json
。
贡献¶
在 ts/torch_handler/request_envelope 下添加新文件。每个文件只包含一个类。在 config.properties
中使用的键将是您编写类所在 .py 文件的名称。