評價此頁

torch.nn.utils.weight_norm.weight_norm#

torch.nn.utils.weight_norm.weight_norm(module, name='weight', dim=0)[原始碼]#

對給定模組中的引數應用權重歸一化。

w=gvv\mathbf{w} = g \dfrac{\mathbf{v}}{\|\mathbf{v}\|}

權重歸一化是一種重引數化技術,它將權重張量的大小與其方向分離開。它用兩個引數替換由 name 指定的引數(例如 'weight'):一個指定大小(例如 'weight_g'),另一個指定方向(例如 'weight_v')。權重歸一化透過一個鉤子實現,該鉤子在每次呼叫 forward() 之前,根據大小和方向重新計算權重張量。

預設情況下,當 dim=0 時,範數是為每個輸出通道/平面獨立計算的。要計算整個權重張量的範數,請使用 dim=None

參見 https://arxiv.org/abs/1602.07868

警告

此函式已棄用。請使用 torch.nn.utils.parametrizations.weight_norm(),它使用了現代的引數化 API。新的 weight_norm 與從舊 weight_norm 生成的 state_dict 相容。

遷移指南

引數
  • module (Module) – 包含的模組

  • name (str, optional) – 權重引數的名稱

  • dim (int, optional) – 計算範數的維度

返回

帶有權重歸一化鉤子的原始模組

返回型別

T_module

示例

>>> m = weight_norm(nn.Linear(20, 40), name='weight')
>>> m
Linear(in_features=20, out_features=40, bias=True)
>>> m.weight_g.size()
torch.Size([40, 1])
>>> m.weight_v.size()
torch.Size([40, 20])