torch.cuda.comm.reduce_add¶ torch.cuda.comm.reduce_add(inputs, destination=None)[源代码][源代码]¶ 对来自多个 GPU 的张量进行求和。 所有输入应具有匹配的形状、dtype 和布局。输出张量将具有相同的形状、dtype 和布局。 参数 inputs (Iterable[Tensor]) – 可迭代的待相加张量。 destination (int, optional) – 输出张量将放置的设备(默认值:当前设备)。 返回 一个张量,包含所有输入按元素相加的结果,放置在 destination 设备上。