torch.nn.utils.weight_norm.weight_norm#
- torch.nn.utils.weight_norm.weight_norm(module, name='weight', dim=0)[原始碼]#
對給定模組中的引數應用權重歸一化。
權重歸一化是一種重引數化技術,它將權重張量的大小與其方向分離開。它用兩個引數替換由
name指定的引數(例如'weight'):一個指定大小(例如'weight_g'),另一個指定方向(例如'weight_v')。權重歸一化透過一個鉤子實現,該鉤子在每次呼叫forward()之前,根據大小和方向重新計算權重張量。預設情況下,當
dim=0時,範數是為每個輸出通道/平面獨立計算的。要計算整個權重張量的範數,請使用dim=None。參見 https://arxiv.org/abs/1602.07868
警告
此函式已棄用。請使用
torch.nn.utils.parametrizations.weight_norm(),它使用了現代的引數化 API。新的weight_norm與從舊weight_norm生成的state_dict相容。遷移指南
大小(
weight_g)和方向(weight_v)現在分別表示為parametrizations.weight.original0和parametrizations.weight.original1。如果您對此感到困擾,請在 pytorch/pytorch#102999 上發表評論。要移除權重歸一化重引數化,請使用
torch.nn.utils.parametrize.remove_parametrizations()。權重不再在模組前向時計算一次;取而代之的是,它將在每次訪問時重新計算。要恢復舊的行為,請在呼叫相關模組之前使用
torch.nn.utils.parametrize.cached()。
- 引數
- 返回
帶有權重歸一化鉤子的原始模組
- 返回型別
T_module
示例
>>> m = weight_norm(nn.Linear(20, 40), name='weight') >>> m Linear(in_features=20, out_features=40, bias=True) >>> m.weight_g.size() torch.Size([40, 1]) >>> m.weight_v.size() torch.Size([40, 20])