快捷方式

torch.cuda.comm.broadcast_coalesced

torch.cuda.comm.broadcast_coalesced(tensors, devices, buffer_size=10485760)[源代码]

将一系列张量广播到指定的 GPU。

小张量首先会合并到一个缓冲区中,以减少同步次数。

参数
  • tensors (序列) – 要广播的张量。必须在同一设备上,无论是 CPU 还是 GPU。

  • devices (Iterable[torch.device, strint]) – 要广播到的 GPU 设备的可迭代对象。

  • buffer_size (int) – 用于合并的缓冲区最大大小

返回值

包含 tensor 的副本的元组,放置在 devices 上。

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取针对初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获得问题的解答

查看资源