torch.nn.utils.weight_norm#
- torch.nn.utils.weight_norm(module, name='weight', dim=0)[原始碼]#
對給定模組中的引數應用權重歸一化。
權重歸一化是一種重引數化,它將權重張量的幅度和方向解耦。它用兩個引數替換由
name指定的引數(例如'weight'):一個指定幅度(例如'weight_g'),一個指定方向(例如'weight_v')。權重歸一化透過一個鉤子實現,該鉤子在每次forward()呼叫之前從幅度和方向重新計算權重張量。預設情況下,當
dim=0時,範數是為每個輸出通道/平面獨立計算的。要計算整個權重張量的範數,請使用dim=None。參見 https://arxiv.org/abs/1602.07868
警告
此函式已棄用。請使用
torch.nn.utils.parametrizations.weight_norm(),它使用現代的引數化 API。新的weight_norm與從舊weight_norm生成的state_dict相容。遷移指南
幅值(
weight_g)和方向(weight_v)現在分別表示為parametrizations.weight.original0和parametrizations.weight.original1。如果您對此感到困擾,請在 pytorch/pytorch#102999 上發表評論。要移除權重歸一化重引數化,請使用
torch.nn.utils.parametrize.remove_parametrizations()。權重不再在模組前向傳播時計算一次;相反,它將在每次訪問時重新計算。要恢復舊行為,請在使用有問題的模組之前使用
torch.nn.utils.parametrize.cached()。
- 引數
- 返回
帶有權重歸一化鉤子的原始模組
- 返回型別
T_module
示例
>>> m = weight_norm(nn.Linear(20, 40), name='weight') >>> m Linear(in_features=20, out_features=40, bias=True) >>> m.weight_g.size() torch.Size([40, 1]) >>> m.weight_v.size() torch.Size([40, 20])