torch.addbmm¶

torch.addbmm(input, batch1, batch2, *, beta=1, alpha=1, out=None) → Tensor¶

执行存储在 batch1 和 batch2 中的矩阵的批量矩阵乘积，并进行约简加法（所有矩阵乘法沿第一维累加）。input 会加到最终结果中。

batch1 和 batch2 必须是 3 维张量，且每个张量包含相同数量的矩阵。

如果 batch1 是一个 $(b \times n \times m)$ 张量，batch2 是一个 $(b \times m \times p)$ 张量，则 input 必须可以广播到 $(n \times p)$ 张量，并且 out 将是一个 $(n \times p)$ 张量。

out = \beta\ \text{input} + \alpha\ (\sum_{i=0}^{b-1} \text{batch1}_i \mathbin{@} \text{batch2}_i)

如果 beta 为 0，则 input 的内容将被忽略，其中的 nan 和 inf 将不会传播。

对于 FloatTensor 或 DoubleTensor 类型的输入，参数 beta 和 alpha 必须是实数，否则应为整数。

此运算符支持 TensorFloat32。

在某些 ROCm 设备上，当使用 float16 输入时，此模块在反向传播时将使用不同精度。

参数

input (Tensor) – 要相加的矩阵
batch1 (Tensor) – 要相乘的第一批矩阵
batch2 (Tensor) – 要相乘的第二批矩阵

关键字参数

beta (Number, optional) – input 的乘数 ( $\beta$ )
alpha (Number, optional) – batch1 @ batch2 的乘数 ( $\alpha$ )
out (Tensor, optional) – 输出张量。

示例

>>> M = torch.randn(3, 5)
>>> batch1 = torch.randn(10, 3, 4)
>>> batch2 = torch.randn(10, 4, 5)
>>> torch.addbmm(M, batch1, batch2)
tensor([[  6.6311,   0.0503,   6.9768, -12.0362,  -2.1653],
        [ -4.8185,  -1.4255,  -6.6760,   8.9453,   2.5743],
        [ -3.8202,   4.3691,   1.0943,  -1.1109,   5.4730]])

torch.addbmm¶

文档

教程

资源