快捷方式

torch.cuda.comm.reduce_add

torch.cuda.comm.reduce_add(inputs, destination=None)[source][source]

对来自多个 GPU 的张量求和。

所有输入应具有匹配的形状、dtype 和布局。输出张量将具有相同的形状、dtype 和布局。

参数
  • inputs (Iterable[Tensor]) – 要相加的张量的可迭代对象。

  • destination (int, optional) – 将放置输出的设备(默认值:当前设备)。

返回

一个包含所有输入的逐元素和的张量,放置在 destination 设备上。

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取面向初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获得您的问题解答

查看资源