評價此頁

torch.cuda.comm.reduce_add#

torch.cuda.comm.reduce_add(inputs, destination=None)[原始碼]#

從多個 GPU 求和張量。

所有輸入應具有匹配的形狀、dtype 和佈局。輸出張量將具有相同的形狀、dtype 和佈局。

引數
  • inputs (Iterable[Tensor]) – 要相加的張量的可迭代物件。

  • destination (int, optional) – 輸出將放置的裝置(預設:當前裝置)。

返回

一個張量,其中包含所有輸入的逐元素和,並放置在 destination 裝置上。