評價此頁

torch.sparse.mm#

torch.sparse.mm()#

執行稀疏矩陣 mat1 和 (稀疏或普通) 矩陣 mat2 的矩陣乘法。與 torch.mm() 類似,如果 mat1 是一個 (n×m)(n \times m) 張量,mat2 是一個 (m×p)(m \times p) 張量,輸出將是一個 (n×p)(n \times p) 張量。當 mat1 是 COO 張量時,它必須具有 sparse_dim = 2。當輸入是 COO 張量時,此函式還支援對兩個輸入的反向傳播。

支援 CSR 和 COO 儲存格式。

注意

此函式不支援計算相對於 CSR 矩陣的導數。

此函式還另外接受一個可選的 reduce 引數,該引數允許指定一個可選的歸約操作,數學上執行以下操作:

zij=k=0K1xikykjz_{ij} = \bigoplus_{k = 0}^{K - 1} x_{ik} y_{kj}

其中 \bigoplus 定義了歸約運算元。reduce 僅在 CPU 裝置上的 CSR 儲存格式下實現。

引數
  • mat1 (張量) – 要相乘的第一個稀疏矩陣

  • mat2 (張量) – 要相乘的第二個矩陣,可以是稀疏的或稠密的

  • reduce (字串, 可選) – 對非唯一索引應用的歸約操作 ("sum", "mean", "amax", "amin")。預設為 "sum"

形狀

此函式輸出張量的格式如下: - 稀疏 x 稀疏 -> 稀疏 - 稀疏 x 稠密 -> 稠密

示例

>>> a = torch.tensor([[1., 0, 2], [0, 3, 0]]).to_sparse().requires_grad_()
>>> a
tensor(indices=tensor([[0, 0, 1],
                       [0, 2, 1]]),
       values=tensor([1., 2., 3.]),
       size=(2, 3), nnz=3, layout=torch.sparse_coo, requires_grad=True)
>>> b = torch.tensor([[0, 1.], [2, 0], [0, 0]], requires_grad=True)
>>> b
tensor([[0., 1.],
        [2., 0.],
        [0., 0.]], requires_grad=True)
>>> y = torch.sparse.mm(a, b)
>>> y
tensor([[0., 1.],
        [6., 0.]], grad_fn=<SparseAddmmBackward0>)
>>> y.sum().backward()
>>> a.grad
tensor(indices=tensor([[0, 0, 1],
                       [0, 2, 1]]),
       values=tensor([1., 0., 2.]),
       size=(2, 3), nnz=3, layout=torch.sparse_coo)
>>> c = a.detach().to_sparse_csr()
>>> c
tensor(crow_indices=tensor([0, 2, 3]),
       col_indices=tensor([0, 2, 1]),
       values=tensor([1., 2., 3.]), size=(2, 3), nnz=3,
       layout=torch.sparse_csr)
>>> y1 = torch.sparse.mm(c, b, 'sum')
>>> y1
tensor([[0., 1.],
        [6., 0.]], grad_fn=<SparseMmReduceImplBackward0>)
>>> y2 = torch.sparse.mm(c, b, 'max')
>>> y2
tensor([[0., 1.],
        [6., 0.]], grad_fn=<SparseMmReduceImplBackward0>)