分数最大池化2d¶
- class torch.nn.FractionalMaxPool2d(kernel_size, output_size=None, output_ratio=None, return_indices=False, _random_samples=None)[source]¶
对由多个输入平面组成的输入信号应用 2D 分数最大池化。
分数最大池化在 Ben Graham 的论文 分数最大池化 中进行了详细描述
最大池化操作应用于 区域,步长大小由目标输出大小随机确定。输出特征的数量等于输入平面的数量。
注意
output_size
或output_ratio
必须且只能定义一个。- 参数
kernel_size (Union[int, Tuple[int, int]]) – 要进行最大运算的窗口大小。可以是单个数字 k(对于 k x k 的方形内核)或元组 (kh, kw)
output_size (Union[int, Tuple[int, int]]) – 图片目标输出大小,格式为 oH x oW。可以是元组 (oH, oW) 或单个数字 oH,表示正方形图像 oH x oH。请注意,我们必须满足 和 .
output_ratio (Union[float, Tuple[float, float]]) – 如果想要输出大小为输入大小的比例,可以使用此选项。此选项必须是范围 (0, 1) 内的数字或元组。请注意,我们必须满足 和 .
return_indices (bool) – 如果为
True
,将返回索引以及输出。用于传递给nn.MaxUnpool2d()
。默认值:False
- 形状
输入: 或 .
输出: 或者 ,其中 或者 .
示例
>>> # pool of square window of size=3, and target output size 13x12 >>> m = nn.FractionalMaxPool2d(3, output_size=(13, 12)) >>> # pool of square window and target output size being half of input image size >>> m = nn.FractionalMaxPool2d(3, output_ratio=(0.5, 0.5)) >>> input = torch.randn(20, 16, 50, 32) >>> output = m(input)