ConvTranspose3d#
- class torch.nn.modules.conv.ConvTranspose3d(in_channels, out_channels, kernel_size, stride=1, padding=0, output_padding=0, groups=1, bias=True, dilation=1, padding_mode='zeros', device=None, dtype=None)[來源]#
對由多個輸入平面組成的輸入影像應用 3D 轉置卷積運算元。轉置卷積運算元逐元素地將每個輸入值與可學習的核進行乘法運算,並對所有輸入特徵平面的輸出進行求和。
該模組可以看作是 Conv3d 相對於其輸入的梯度。它也被稱為分數步長卷積或反捲積(儘管它並不是真正的反捲積操作,因為它不計算卷積的真實逆)。有關更多資訊,請參閱 此處 的視覺化以及 Deconvolutional Networks 論文。
此模組支援 TensorFloat32。
在某些 ROCm 裝置上,當使用 float16 輸入時,此模組將對反向傳播使用不同精度。
stride控制互相關的步長。padding控制兩側的隱式零填充量,其值為dilation * (kernel_size - 1) - padding個點。有關詳細資訊,請參閱下面的說明。output_padding控制新增到輸出形狀一側的額外尺寸。有關詳細資訊,請參見下面的註釋。dilation控制核點之間的間距;也稱為 à trous 演算法。這比較難描述,但 此處 的連結對dilation的作用有很好的視覺化。groups控制輸入和輸出之間的連線。in_channels和out_channels都必須能被groups整除。例如,當 groups=1 時,所有輸入都會與所有輸出進行卷積。
當 groups=2 時,操作相當於有兩個並排的卷積層,每個層看到一半的輸入通道併產生一半的輸出通道,然後將兩者連線起來。
當 groups =
in_channels時,每個輸入通道都與自己的一組濾波器進行卷積(大小為 )。
引數
kernel_size、stride、padding、output_padding可以是一個單獨的
int—— 這種情況下,深度、高度和寬度維度都使用相同的值。一個由三個整陣列成的
tuple—— 這種情況下,第一個 int 用於深度維度,第二個 int 用於高度維度,第三個 int 用於寬度維度。
注意
引數
padding會在輸入的每個維度兩側有效地新增dilation * (kernel_size - 1) - padding的零填充量。這樣設定是為了當Conv3d和ConvTranspose3d使用相同的引數初始化時,它們在輸入和輸出形狀上是互逆的。然而,當stride > 1時,Conv3d會將多個輸入形狀對映到相同的輸出形狀。引數output_padding用於解決這種歧義,它透過有效地在輸出形狀的一側增加計算出的形狀來解決。請注意,output_padding僅用於確定輸出形狀,而不會實際向輸出新增零填充。注意
在某些情況下,當在 CUDA 裝置上使用張量並利用 CuDNN 時,此運算元可能會選擇一個非確定性演算法來提高效能。如果這不可取,你可以嘗試將操作設定為確定性的(可能以效能為代價),方法是設定
torch.backends.cudnn.deterministic = True。有關更多資訊,請參閱 可復現性。- 引數
in_channels (int) – 輸入影像中的通道數
out_channels (int) – 卷積產生的通道數
padding (int 或 tuple,可選) – 在輸入的每個維度兩側會新增
dilation * (kernel_size - 1) - padding的零填充。預設值:0output_padding (int 或 tuple,可選) – 在輸出形狀的每個維度的一側新增的額外尺寸。預設值:0
groups (int, 可選) – 從輸入通道到輸出通道的阻塞連線數。預設為:1
bias (bool, 可選) – 如果為
True,則向輸出新增可學習的偏置。預設為:True
- 形狀
輸入: 或
輸出: 或 ,其中
- 變數
示例
>>> # With square kernels and equal stride >>> m = nn.ConvTranspose3d(16, 33, 3, stride=2) >>> # non-square kernels and unequal stride and with padding >>> m = nn.ConvTranspose3d(16, 33, (3, 5, 2), stride=(2, 1, 1), padding=(0, 4, 2)) >>> input = torch.randn(20, 16, 10, 50, 100) >>> output = m(input)