評價此頁

torch.baddbmm#

torch.baddbmm(input, batch1, batch2, out_dtype=None, *, beta=1, alpha=1, out=None) Tensor#

執行 batch1batch2 中矩陣的批次矩陣乘法。 input 被加到最終結果中。

batch1batch2 必須是 3 維張量,每個張量包含相同數量的矩陣。

如果 batch1 是一個 (b×n×m)(b \times n \times m) 張量, batch2 是一個 (b×m×p)(b \times m \times p) 張量,那麼 input 必須與一個 (b×n×p)(b \times n \times p) 張量 可廣播,並且 out 將是一個 (b×n×p)(b \times n \times p) 張量。 alphabeta 的含義與 torch.addbmm() 中使用的縮放因子相同。

outi=β inputi+α (batch1i@batch2i)\text{out}_i = \beta\ \text{input}_i + \alpha\ (\text{batch1}_i \mathbin{@} \text{batch2}_i)

如果 beta 為 0,則 input 的內容將被忽略,並且其中的 naninf 不會被傳播。

對於 FloatTensorDoubleTensor 型別的輸入,引數 betaalpha 必須是實數,否則它們應該是整數。

此運算子支援TensorFloat32

在某些 ROCm 裝置上,當使用 float16 輸入時,此模組將對反向傳播使用不同精度

引數
  • input (Tensor) – 要新增的張量

  • batch1 (Tensor) – 要相乘的第一個矩陣批次

  • batch2 (Tensor) – 要相乘的第二個矩陣批次

  • out_dtype (dtype, optional) – 輸出張量的資料型別。僅在 CUDA 上支援,並且當輸入資料型別為 torch.float16/torch.bfloat16 時,支援 torch.float32。

關鍵字引數
  • beta (Number, optional) – input 的乘數(β\beta

  • alpha (Number, optional) – batch1@batch2\text{batch1} \mathbin{@} \text{batch2} 的乘數(α\alpha

  • out (Tensor, optional) – 輸出張量。

示例

>>> M = torch.randn(10, 3, 5)
>>> batch1 = torch.randn(10, 3, 4)
>>> batch2 = torch.randn(10, 4, 5)
>>> torch.baddbmm(M, batch1, batch2).size()
torch.Size([10, 3, 5])