Serve¶
这些组件旨在简化与推理和服务工具(如 torchserve)的交互。
- torchx.components.serve.torchserve(model_path: str, management_api: str, image: str = 'ghcr.io/pytorch/torchx:0.7.0', params: Optional[Dict[str, object]] = None, dryrun: bool = False) AppDef [source]¶
将提供的模型部署到给定的 torchserve 管理 API 端点。
>>> from torchx.components.serve import torchserve >>> torchserve( ... model_path="s3://your-bucket/your-model.pt", ... management_api="http://torchserve:8081", ... ) AppDef(name='torchx-torchserve', ...)
- 参数:
model_path – 模型归档文件的 fsspec 路径。
management_api – torchserve 管理 API 根目录的 URL。
image – 要使用的容器。
params – torchserve 参数。请参阅 https://pytorch.ac.cn/serve/management_api.html#register-a-model
dryrun – 启动应用程序,但不执行实际工作
- 返回值:
TorchX 应用程序定义
- 返回类型: