快捷方式

FractionalMaxPool2d

class torch.nn.FractionalMaxPool2d(kernel_size, output_size=None, output_ratio=None, return_indices=False, _random_samples=None)[source][source]

对由多个输入平面组成的输入信号应用 2D 分数最大池化。

分数最大池化的详细描述请见 Ben Graham 的论文 Fractional MaxPooling

最大池化操作在 kH×kWkH \times kW 区域中应用,步长大小由目标输出大小随机确定。输出特征的数量等于输入平面的数量。

注意

output_sizeoutput_ratio 必须且只能定义一个。

参数
  • kernel_size (Union[int, Tuple[int, int]]) – 最大池化窗口的大小。可以是一个数字 k(表示 k x k 的方形核)或一个元组 (kh, kw)

  • output_size (Union[int, Tuple[int, int]]) – 目标输出图像大小,形式为 oH x oW。可以是元组 (oH, oW) 或单个数字 oH(表示方形图像 oH x oH)。请注意,我们必须有 kH+oH1<=HinkH + oH - 1 <= H_{in}kW+oW1<=WinkW + oW - 1 <= W_{in}

  • output_ratio (Union[float, Tuple[float, float]]) – 如果希望输出大小为输入大小的比率,则可以提供此选项。这必须是范围 (0, 1) 中的数字或元组。请注意,我们必须有 kH+(output_ratio_HHin)1<=HinkH + (output\_ratio\_H * H_{in}) - 1 <= H_{in}kW+(output_ratio_WWin)1<=WinkW + (output\_ratio\_W * W_{in}) - 1 <= W_{in}

  • return_indices (bool) – 如果为 True,将返回输出以及索引。对于传递给 nn.MaxUnpool2d() 非常有用。默认值: False

形状
  • 输入: (N,C,Hin,Win)(N, C, H_{in}, W_{in})(C,Hin,Win)(C, H_{in}, W_{in})

  • 输出: (N,C,Hout,Wout)(N, C, H_{out}, W_{out})(C,Hout,Wout)(C, H_{out}, W_{out}),其中 (Hout,Wout)=output_size(H_{out}, W_{out})=\text{output\_size}(Hout,Wout)=output_ratio×(Hin,Win)(H_{out}, W_{out})=\text{output\_ratio} \times (H_{in}, W_{in})

示例

>>> # pool of square window of size=3, and target output size 13x12
>>> m = nn.FractionalMaxPool2d(3, output_size=(13, 12))
>>> # pool of square window and target output size being half of input image size
>>> m = nn.FractionalMaxPool2d(3, output_ratio=(0.5, 0.5))
>>> input = torch.randn(20, 16, 50, 32)
>>> output = m(input)

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取面向初学者和高级开发者的深度教程

查看教程

资源

查找开发资源并获得问题解答

查看资源