快捷方式

torch.linalg.qr

torch.linalg.qr(A, mode='reduced', *, out=None)

计算矩阵的 QR 分解。

K\mathbb{K}R\mathbb{R}C\mathbb{C},矩阵 AKm×nA \in \mathbb{K}^{m \times n} 的 **完全 QR 分解** 定义为

A=QRQKm×m,RKm×nA = QR\mathrlap{\qquad Q \in \mathbb{K}^{m \times m}, R \in \mathbb{K}^{m \times n}}

其中 QQ 在实数情况下是正交的,在复数情况下是酉的,而 RR 是上三角矩阵,对角线为实数(即使在复数情况下也是)。

m > n(高矩阵)时,由于 R 是上三角矩阵,因此其最后的 m - n 行为零。在这种情况下,我们可以删除 Q 的最后 m - n 列以形成 **简化 QR 分解**

A=QRQKm×n,RKn×nA = QR\mathrlap{\qquad Q \in \mathbb{K}^{m \times n}, R \in \mathbb{K}^{n \times n}}

n >= m(宽矩阵)时,缩减的 QR 分解与完整的 QR 分解一致。

支持输入 float、double、cfloat 和 cdouble 数据类型。还支持矩阵批次,如果 A 是一个矩阵批次,则输出具有相同的批次维度。

参数 mode 在完整的 QR 分解和缩减的 QR 分解之间进行选择。如果 A 形状为 (*, m, n),表示 k = min(m, n)

  • mode= ‘reduced’(默认):返回形状分别为 (*, m, k)(*, k, n)(Q, R)。它始终可微分。

  • mode= ‘complete’:返回形状分别为 (*, m, m)(*, m, n)(Q, R)。它在 m <= n 时可微分。

  • mode= ‘r’:仅计算缩减的 R。返回 (Q, R),其中 Q 为空,R 形状为 (*, k, n)。它永远不可微分。

numpy.linalg.qr 的区别

  • mode= ‘raw’ 未实现。

  • numpy.linalg.qr 不同,此函数始终返回两个张量元组。当 mode= ‘r’ 时,Q 张量为空张量。

警告

R 对角线上的元素不一定为正。因此,返回的 QR 分解仅在 R 对角线的符号上唯一。因此,不同的平台,如 NumPy,或不同设备上的输入,可能会产生不同的有效分解。

警告

只有当 A 中每个矩阵的前 k = min(m, n) 列线性无关时,QR 分解才定义良好。如果此条件不满足,则不会抛出错误,但生成的 QR 可能不正确,其自动微分可能会失败或产生不正确的结果。

参数
  • A (Tensor) – 形状为 (*, m, n) 的张量,其中 * 为零个或多个批次维度。

  • mode (str, optional) – ‘reduced’‘complete’‘r’ 之一。控制返回的张量的形状。默认值:‘reduced’

关键字参数

out (tuple, optional) – 两个张量的输出元组。如果为 None 则忽略。默认值:None

返回值

一个名为元组 (Q, R)

示例

>>> A = torch.tensor([[12., -51, 4], [6, 167, -68], [-4, 24, -41]])
>>> Q, R = torch.linalg.qr(A)
>>> Q
tensor([[-0.8571,  0.3943,  0.3314],
        [-0.4286, -0.9029, -0.0343],
        [ 0.2857, -0.1714,  0.9429]])
>>> R
tensor([[ -14.0000,  -21.0000,   14.0000],
        [   0.0000, -175.0000,   70.0000],
        [   0.0000,    0.0000,  -35.0000]])
>>> (Q @ R).round()
tensor([[  12.,  -51.,    4.],
        [   6.,  167.,  -68.],
        [  -4.,   24.,  -41.]])
>>> (Q.T @ Q).round()
tensor([[ 1.,  0.,  0.],
        [ 0.,  1., -0.],
        [ 0., -0.,  1.]])
>>> Q2, R2 = torch.linalg.qr(A, mode='r')
>>> Q2
tensor([])
>>> torch.equal(R, R2)
True
>>> A = torch.randn(3, 4, 5)
>>> Q, R = torch.linalg.qr(A, mode='complete')
>>> torch.dist(Q @ R, A)
tensor(1.6099e-06)
>>> torch.dist(Q.mT @ Q, torch.eye(4))
tensor(6.2158e-07)

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并获得问题的解答

查看资源