torch.linalg.lstsq#

torch.linalg.lstsq(A, B, rcond=None, *, driver=None)#

計算線性方程組的最小二乘問題的解。

令 $\mathbb{K}$ 為 $\mathbb{R}$ 或 $\mathbb{C}$ ，對於線性系統 $AX = B$ ，其中 $A \in \mathbb{K}^{m \times n}, B \in \mathbb{K}^{m \times k}$ 的最小二乘問題定義為

\min_{X \in \mathbb{K}^{n \times k}} \|AX - B\|_F

其中 $\|-\|_F$ 表示 Frobenius 範數。

支援float、double、cfloat和cdouble資料型別的輸入。也支援矩陣的批次，如果輸入是矩陣的批次，則輸出具有相同的批次維度。

driver 選擇將要使用的後端函式。對於 CPU 輸入，有效值為 ‘gels’、‘gelsy’、‘gelsd、‘gelss’。要在 CPU 上選擇最佳驅動程式，請考慮以下幾點：

如果 A 是良態的（其條件數不是太大），或者您不介意一些精度損失。
- 對於一般矩陣：‘gelsy’（帶主元的 QR 分解）（預設）
- 如果 A 是滿秩的：‘gels’（QR 分解）
如果 A 不是良態的。
- ‘gelsd’（三對角化和 SVD）
- 但是如果您遇到記憶體問題：‘gelss’（全 SVD）。

對於 CUDA 輸入，唯一有效的驅動程式是 ‘gels’，它假定 A 是滿秩的。

還可以參見這些驅動程式的完整描述。

rcond 用於確定 A 中矩陣的有效秩，當 driver 是 (‘gelsy’, ‘gelsd’, ‘gelss’) 之一時。在這種情況下，如果 $\sigma_i$ 是 A 的按降序排列的奇異值，當 $\sigma_i$ 小於或等於 $\text{rcond} \cdot \sigma_1$ 時， $\sigma_i$ 將向下舍入為零。如果 rcond= None（預設），則 rcond 設定為 A 的 dtype 的機器精度乘以 max(m, n)。

此函式在命名的四元組 (solution, residuals, rank, singular_values) 中返回問題的解和一些額外資訊。對於形狀分別為 (*, m, n) 和 (*, m, k) 的輸入 A 和 B，它包含：

solution：最小二乘解。其形狀為 (*, n, k)。
residuals：解的平方殘差，即 $\|AX - B\|_F^2$ 。其形狀為 (*, k)。當 m > n 且 A 中的每個矩陣都是滿秩的時計算，否則為空張量。如果 A 是矩陣的批次，並且批次中的任何矩陣不是滿秩的，則返回一個空張量。此行為在未來的 PyTorch 版本中可能會發生變化。
rank：A 中矩陣的秩的張量。其形狀等於 A 的批次維度。當 driver 是 (‘gelsy’, ‘gelsd’, ‘gelss’) 之一時計算，否則為空張量。
singular_values：A 中矩陣的奇異值的張量。其形狀為 (*, min(m, n))。當 driver 是 (‘gelsd’, ‘gelss’) 之一時計算，否則為空張量。

注意

此函式以比單獨進行計算更快、更穩定的方式計算 X = A.pinverse() @ B。

警告

rcond 的預設值可能會在未來的 PyTorch 版本中更改。因此，建議使用固定值以避免潛在的破壞性更改。

引數

A (Tensor) – 左側張量，形狀為 (*, m, n)，其中 * 是零個或多個批次維度。
B (Tensor) – 右側張量，形狀為 (*, m, k)，其中 * 是零個或多個批次維度。
rcond (float, optional) – 用於確定 A 的有效秩。如果 rcond= None，則 rcond 設定為 A 的 dtype 的機器精度乘以 max(m, n)。預設值：None。

關鍵字引數

driver (str, optional) – 要使用的 LAPACK/MAGMA 方法的名稱。如果為 None，則對 CPU 輸入使用 ‘gelsy’，對 CUDA 輸入使用 ‘gels’。預設值：None。

返回

一個命名的元組 (solution, residuals, rank, singular_values)。

示例

>>> A = torch.randn(1,3,3)
>>> A
tensor([[[-1.0838,  0.0225,  0.2275],
     [ 0.2438,  0.3844,  0.5499],
     [ 0.1175, -0.9102,  2.0870]]])
>>> B = torch.randn(2,3,3)
>>> B
tensor([[[-0.6772,  0.7758,  0.5109],
     [-1.4382,  1.3769,  1.1818],
     [-0.3450,  0.0806,  0.3967]],
    [[-1.3994, -0.1521, -0.1473],
     [ 1.9194,  1.0458,  0.6705],
     [-1.1802, -0.9796,  1.4086]]])
>>> X = torch.linalg.lstsq(A, B).solution # A is broadcasted to shape (2, 3, 3)
>>> torch.dist(X, torch.linalg.pinv(A) @ B)
tensor(1.5152e-06)

>>> S = torch.linalg.lstsq(A, B, driver='gelsd').singular_values
>>> torch.dist(S, torch.linalg.svdvals(A))
tensor(2.3842e-07)

>>> A[:, 0].zero_()  # Decrease the rank of A
>>> rank = torch.linalg.lstsq(A, B).rank
>>> rank
tensor([2])

torch.linalg.lstsq#

文件

教程

資源