評價此頁

MaxPool1d#

class torch.nn.modules.pooling.MaxPool1d(kernel_size, stride=None, padding=0, dilation=1, return_indices=False, ceil_mode=False)[原始碼]#

對由多個輸入平面組成的輸入訊號應用 1D 最大池化。

在最簡單的情況下,具有輸入尺寸 (N,C,L)(N, C, L) 和輸出 (N,C,Lout)(N, C, L_{out}) 的圖層的輸出值可以精確地描述為:

out(Ni,Cj,k)=maxm=0,,kernel_size1input(Ni,Cj,stride×k+m)out(N_i, C_j, k) = \max_{m=0, \ldots, \text{kernel\_size} - 1} input(N_i, C_j, stride \times k + m)

如果 padding 非零,則輸入將在兩側隱式地用負無窮大進行填充,填充長度為 paddingdilation 是滑動視窗內元素之間的步幅。這個 連結 有一個關於池化引數的精彩視覺化。

注意

當 ceil_mode=True 時,如果滑動視窗從左側填充或輸入開始,則允許它們超出邊界。從右側填充區域開始的滑動視窗將被忽略。

引數
  • kernel_size (Union[int, tuple[int]]) – 滑動視窗的大小,必須 > 0。

  • stride (Union[int, tuple[int]]) – 滑動視窗的步幅,必須 > 0。預設值為 kernel_size

  • padding (Union[int, tuple[int]]) – 要新增到兩端的隱式負無窮大填充,必須 >= 0 且 <= kernel_size / 2。

  • dilation (Union[int, tuple[int]]) – 滑動視窗內元素的步幅,必須 > 0。

  • return_indices (bool) – 如果為 True,則將返回最大值的 argmax。對於之後的 torch.nn.MaxUnpool1d 很有用。

  • ceil_mode (bool) – 如果為 True,將使用 ceil 而不是 floor 來計算輸出形狀。這確保輸入張量中的每個元素都覆蓋在滑動視窗內。

形狀
  • 輸入:(N,C,Lin)(N, C, L_{in})(C,Lin)(C, L_{in})

  • 輸出:(N,C,Lout)(N, C, L_{out})(C,Lout)(C, L_{out})

    其中 ceil_mode = False

    Lout=Lin+2×paddingdilation×(kernel_size1)1stride+1L_{out} = \left\lfloor \frac{L_{in} + 2 \times \text{padding} - \text{dilation} \times (\text{kernel\_size} - 1) - 1}{\text{stride}}\right\rfloor + 1

    其中 ceil_mode = True

    Lout=Lin+2×paddingdilation×(kernel_size1)1+(stride1)stride+1L_{out} = \left\lceil \frac{L_{in} + 2 \times \text{padding} - \text{dilation} \times (\text{kernel\_size} - 1) - 1 + (stride - 1)}{\text{stride}}\right\rceil + 1
  • 確保最後一個池化操作從影像內部開始,使 Lout=Lout1L_{out} = L_{out} - 1(Lout1)stride>=Lin+padding(L_{out} - 1) * \text{stride} >= L_{in} + \text{padding}

示例

>>> # pool of size=3, stride=2
>>> m = nn.MaxPool1d(3, stride=2)
>>> input = torch.randn(20, 16, 50)
>>> output = m(input)
forward(input)[原始碼]#

執行前向傳播。