快捷方式

torch.addbmm

torch.addbmm(input, batch1, batch2, *, beta=1, alpha=1, out=None) Tensor

对存储在 batch1batch2 中的矩阵执行批矩阵乘法,并进行简化的加法步骤(所有矩阵乘法都沿着第一个维度累加)。input 被添加到最终结果中。

batch1batch2 必须是 3 维张量,每个张量包含相同数量的矩阵。

如果 batch1(b×n×m)(b \times n \times m) 张量,batch2(b×m×p)(b \times m \times p) 张量,input 必须广播(n×p)(n \times p) 张量,而 out 将是一个 (n×p)(n \times p) 张量。

out=β input+α (i=0b1batch1i@batch2i)out = \beta\ \text{input} + \alpha\ (\sum_{i=0}^{b-1} \text{batch1}_i \mathbin{@} \text{batch2}_i)

如果 beta 为 0,则 input 将被忽略,其中 naninf 不会被传播。

对于类型为 FloatTensorDoubleTensor 的输入,参数 betaalpha 必须是实数,否则它们应该是整数。

此运算符支持 TensorFloat32

在某些 ROCm 设备上,当使用 float16 输入时,此模块将使用 不同的精度 进行反向传播。

参数
  • batch1 (Tensor) – 要相乘的第一个矩阵批次

  • batch2 (Tensor) – 要相乘的第二个矩阵批次

关键字参数
  • beta (Number, optional) – input 的乘数 (β\beta)

  • input (Tensor) – 要添加的矩阵

  • alpha (Number, optional) – batch1 @ batch2 的乘数 (α\alpha)

  • out (Tensor, optional) – 输出张量。

示例

>>> M = torch.randn(3, 5)
>>> batch1 = torch.randn(10, 3, 4)
>>> batch2 = torch.randn(10, 4, 5)
>>> torch.addbmm(M, batch1, batch2)
tensor([[  6.6311,   0.0503,   6.9768, -12.0362,  -2.1653],
        [ -4.8185,  -1.4255,  -6.6760,   8.9453,   2.5743],
        [ -3.8202,   4.3691,   1.0943,  -1.1109,   5.4730]])

文档

访问 PyTorch 的全面的开发者文档

查看文档

教程

获取针对初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并获得问题的解答

查看资源