torch.Tensor.backward#
- Tensor.backward(gradient=None, retain_graph=None, create_graph=False, inputs=None)[原始碼]#
計算當前張量相對於圖葉的梯度。
該圖使用鏈式法則進行區分。如果張量是非標量(即其資料包含多個元素)並且需要梯度,則該函式還需要指定一個
gradient。它應該是與self具有匹配型別和形狀的張量,代表被微分函式相對於self的梯度。此函式會累積葉節點的梯度 — 您可能需要在呼叫它之前將
.grad屬性歸零或將其設定為None。有關累積梯度的記憶體佈局的詳細資訊,請參閱 預設梯度佈局。注意
如果您在使用者指定的 CUDA 流上下文中執行任何前向操作、建立
gradient以及/或呼叫backward,請參閱 反向傳播的流語義。注意
當提供了
inputs並且給定的輸入不是葉節點時,當前實現將呼叫其 grad_fn(儘管為了獲得該梯度,這並不是嚴格必需的)。這是一個使用者不應依賴的實現細節。有關更多詳細資訊,請參閱 pytorch/pytorch#60521。- 引數
gradient (Tensor, optional) – 被微分函式相對於
self的梯度。如果self是標量,則可以省略此引數。預設為None。retain_graph (bool, optional) – 如果為
False,則用於計算梯度的圖將被釋放;如果為True,則將被保留。預設為None,在這種情況下,該值是從create_graph推斷的(即,只有在請求更高階導數跟蹤時才會保留圖)。請注意,在幾乎所有情況下,將此選項設定為True都是不必要的,並且通常可以透過更有效的方式解決。create_graph (bool, optional) – 如果為
True,將構建導數的圖,從而能夠計算更高階的導數積。預設為False。inputs (Sequence[Tensor], optional) – 將在其上將梯度累積到
.grad中的輸入。所有其他張量將被忽略。如果未提供,則梯度將累積到用於計算tensors的所有葉張量中。預設為None。