Torch 分布式弹性¶ 使分布式 PyTorch 具备容错性和弹性。 入门¶ 用法 快速入门 训练脚本 示例 文档¶ API torchrun(弹性启动) 弹性代理 多进程 错误传播 会合 过期计时器 指标 事件 子进程处理 控制平面 高级 自定义 插件 TorchElastic Kubernetes