評價此頁

FractionalMaxPool2d#

class torch.nn.modules.pooling.FractionalMaxPool2d(kernel_size, output_size=None, output_ratio=None, return_indices=False, _random_samples=None)[原始碼]#

對由多個輸入平面組成的輸入訊號應用 2D 分數最大池化。

Fractional MaxPooling 的詳細描述請參見論文 Fractional MaxPooling (作者: Ben Graham)。

最大池化操作在一個 kH×kWkH \times kW 的區域內應用,步長由目標輸出尺寸隨機確定。輸出特徵的數量等於輸入平面的數量。

注意

必須定義 output_sizeoutput_ratio 中的一個且僅一個。

引數
  • kernel_size (Union[int, tuple[int, int]]) – 用於最大池化的視窗大小。可以是單個數字 k(表示 k x k 的方形視窗)或一個元組 (kh, kw)

  • output_size (Union[int, tuple[int, int]]) – 影像的目標輸出尺寸,形式為 oH x oW。可以是元組 (oH, oW) 或單個數字 oH(表示方形影像 oH x oH)。請注意,必須滿足 kH+oH1<=HinkH + oH - 1 <= H_{in} and kW+oW1<=WinkW + oW - 1 <= W_{in}

  • output_ratio (Union[float, tuple[float, float]]) – 如果希望輸出尺寸是輸入尺寸的比例,可以使用此選項。該值必須是 (0, 1) 範圍內的數字或元組。請注意,必須滿足 kH+(output_ratio_HHin)1<=HinkH + (output\_ratio\_H * H_{in}) - 1 <= H_{in} and kW+(output_ratio_WWin)1<=WinkW + (output\_ratio\_W * W_{in}) - 1 <= W_{in}

  • return_indices (bool) – 如果設定為 True,將同時返回索引和輸出。這對於傳遞給 nn.MaxUnpool2d() 非常有用。預設為 False

形狀
  • 輸入: (N,C,Hin,Win)(N, C, H_{in}, W_{in})(C,Hin,Win)(C, H_{in}, W_{in})

  • 輸出: (N,C,Hout,Wout)(N, C, H_{out}, W_{out})(C,Hout,Wout)(C, H_{out}, W_{out})

示例

>>> # pool of square window of size=3, and target output size 13x12
>>> m = nn.FractionalMaxPool2d(3, output_size=(13, 12))
>>> # pool of square window and target output size being half of input image size
>>> m = nn.FractionalMaxPool2d(3, output_ratio=(0.5, 0.5))
>>> input = torch.randn(20, 16, 50, 32)
>>> output = m(input)