快捷方式

ts 软件包

子软件包

子模块

ts.arg_parser 模块

此模块解析通过 torchserve 命令行给出的参数。这在运行时被 model-server 使用。

class ts.arg_parser.ArgParser[source]

基类: object

torchserve 和 torchserve-export 命令的参数解析器 TODO:添加自述文件 URL

static extract_args(args=None)[source]
static model_service_worker_args()[source]

后端工作进程的 ArgParser。接受套接字名称和套接字类型。 :return

static ts_parser()[source]

用于 torchserve 启动服务的参数解析器

ts.context 模块

传入请求的上下文对象

class ts.context.Context(model_name, model_dir, manifest, batch_size, gpu, mms_version, limit_max_image_pixels=True, metrics=None, model_yaml_config=None)[source]

基类: object

Context 存储模型相关的 Worker 信息。有些在加载时是固定的,有些由服务设置

get_all_request_header(idx: int) Dict[str, str][source]
get_request_header(idx: int, key: str) Optional[str][source]
get_request_id(idx: int = 0) Optional[str][source]
get_response_content_type(idx: int) Optional[str][source]
get_response_headers(idx: int) Dict[str, str][source]
get_response_status(idx: int) Tuple[int, str][source]
get_sequence_id(idx: int) str[source]
property metrics
property request_processor
set_all_response_status(code: int = 200, phrase: str = '') None[source]

设置各个请求的状态代码 :param phrase: :param code: :return

set_response_content_type(idx: int, value: str) None[source]
set_response_header(idx, key, value)[source]
set_response_status(code: int = 200, phrase: str = '', idx: int = 0)[source]

设置各个请求的状态代码 :param phrase: :param idx: 发送到 handle() 方法的 list(data) 中的索引数据 :param code: :return

property system_properties
class ts.context.RequestProcessor(request_header: dict)[source]

基类: object

请求处理器

add_response_property(key: str, value: str) None[source]
get_request_properties() dict[source]
get_request_property(key: str) Optional[str][source]
get_response_header(key: str) Optional[str][source]
get_response_headers() dict[source]
get_response_status_code() int[source]
get_response_status_phrase() Optional[str][source]
report_status(code, reason_phrase=None) None[source]

ts.model_loader 模块

模型加载器。

class ts.model_loader.ModelLoader[source]

基类: object

基本模型加载器类。

abstract load(model_name: str, model_dir: str, handler: Optional[str] = None, gpu_id: Optional[int] = None, batch_size: Optional[int] = None, envelope: Optional[str] = None, limit_max_image_pixels: Optional[bool] = True)[source]

从文件加载模型。

参数:
  • model_name

  • model_dir

  • handler

  • gpu_id

  • batch_size

  • envelope

  • limit_max_image_pixels

返回:

模型

class ts.model_loader.ModelLoaderFactory[source]

基类: object

static get_model_loader()[source]
class ts.model_loader.TsModelLoader[source]

基类: ModelLoader

TorchServe 1.0 模型加载器

load(model_name: str, model_dir: str, handler: Optional[str] = None, gpu_id: Optional[int] = None, batch_size: Optional[int] = None, envelope: Optional[str] = None, limit_max_image_pixels: Optional[bool] = True, metrics_cache: Optional[MetricsCacheYamlImpl] = None) Service[source]

从文件加载 TorchServe 1.0 模型。

参数:
  • model_name

  • model_dir

  • handler

  • gpu_id

  • batch_size

  • envelope

  • limit_max_image_pixels

  • metrics_cache – MetricsCacheYamlImpl 对象

返回:

ts.model_server 模块

用于定义模型服务器入口点的文件

ts.model_server.load_properties(file_path: str) Dict[str, str][source]

将属性文件读取到映射中。

ts.model_server.start() None[source]

这是模型服务器的入口点 :return

ts.model_service_worker 模块

ModelServiceWorker 是由 MMS 前端启动的工作进程。通信消息格式:二进制编码

class ts.model_service_worker.TorchModelServiceWorker(s_type: Optional[str] = None, s_name: Optional[str] = None, host_addr: Optional[str] = None, port_num: Optional[int] = None, metrics_config: Optional[str] = None, async_comm: Optional[bool] = False)[source]

基类: object

后端工作进程,用于处理模型服务器的 Python 服务代码

handle_connection(cl_socket)[source]

处理套接字连接。

参数:

cl_socket

返回:

handle_connection_async(cl_socket)[source]

处理套接字连接。

参数:

cl_socket

返回:

load_model(load_model_request)[source]

期望的命令 {

“command” : “load”, string “modelPath” : “/path/to/model/file”, string “modelName” : “name”, string “gpu” : None if CPU else gpu_id, int “handler” : 如果提供,则为服务处理程序入口点,string “envelope” : 如果提供,则为请求数据的包装器/解包器的名称,string “batchSize” : 批处理大小,int “limitMaxImagePixels”: 限制 Pillow 图像 max_image_pixels,bool

}

参数:

load_model_request

返回:

run_server()[source]

运行后端工作进程并在套接字上监听 :return

ts.service 模块

CustomService 类定义

class ts.service.Service(model_name, model_dir, manifest, entry_point, gpu, batch_size, limit_max_image_pixels=True, metrics_cache=None)[source]

基类: object

自定义 entry_point 的包装器

property context
predict(batch)[source]
PREDICT 命令 = {

“command”: “predict”, “batch”: [ REQUEST_INPUT ]

} :param batch: 请求列表 :return

static retrieve_data_for_inference(batch)[source]
REQUEST_INPUT = {

“requestId” : “111-222-3333”, “parameters” : [ PARAMETER ]

}

PARAMETER = {

“name” : 参数名称 “contentType”: “http-content-types”, “value”: “val1”

}

参数:

batch

返回:

set_cl_socket(cl_socket)[source]
ts.service.emit_metrics(metrics)[source]

在提供的字典中发出指标

参数:
  • metrics (所有指标的字典) –

  • metrics

  • metric_name (当键为) –

  • object (值为指标对象) –

ts.version 模块

这是 TorchServe 的当前版本

模块内容

此模块执行以下操作:a. 启动模型服务器。b. 根据配置的模型创建端点。c. 公开标准 “ping” 和 “api-description” 端点。d. 等待服务推理请求。

文档

访问 PyTorch 的综合开发者文档

查看文档

教程

获取面向初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获得您的问题解答

查看资源