FractionalMaxPool2d¶

class torch.nn.FractionalMaxPool2d(kernel_size, output_size=None, output_ratio=None, return_indices=False, _random_samples=None)[源码][源码]¶

在由多个输入平面组成的输入信号上应用二维分数最大池化。

分数最大池化在 Ben Graham 的论文 Fractional MaxPooling 中有详细描述。

最大池化操作在 $kH \times kW$ 区域上应用，通过由目标输出大小确定的随机步长进行。输出特征的数量等于输入平面的数量。

注意

output_size 和 output_ratio 中必须且只能定义一个。

参数

kernel_size (Union[int, tuple[int, int]]) – 执行最大池化的窗口大小。可以是一个整数 k（对于 k x k 的方形核）或一个元组 (kh, kw)
output_size (Union[int, tuple[int, int]]) – 目标输出图像大小，形式为 oH x oW。可以是一个元组 (oH, oW) 或一个整数 oH（对于方形图像 oH x oH）。请注意，我们必须满足 $kH + oH - 1 <= H_{in}$ 和 $kW + oW - 1 <= W_{in}$
output_ratio (Union[float, tuple[float, float]]) – 如果希望输出大小是输入大小的一个比例，则可以给出此选项。这必须是一个在 (0, 1) 范围内的数字或元组。请注意，我们必须满足 $kH + (output\_ratio\_H * H_{in}) - 1 <= H_{in}$ 和 $kW + (output\_ratio\_W * W_{in}) - 1 <= W_{in}$
return_indices (bool) – 如果为 True，则与输出一起返回索引。这对于传递给 nn.MaxUnpool2d() 很有用。默认值: False

形状

输入: $(N, C, H_{in}, W_{in})$ 或 $(C, H_{in}, W_{in})$ 。
输出: $(N, C, H_{out}, W_{out})$ 或 $(C, H_{out}, W_{out})$ ，其中 $(H_{out}, W_{out})=\text{output\_size}$ 或 $(H_{out}, W_{out})=\text{output\_ratio} \times (H_{in}, W_{in})$ 。

示例

>>> # pool of square window of size=3, and target output size 13x12
>>> m = nn.FractionalMaxPool2d(3, output_size=(13, 12))
>>> # pool of square window and target output size being half of input image size
>>> m = nn.FractionalMaxPool2d(3, output_ratio=(0.5, 0.5))
>>> input = torch.randn(20, 16, 50, 32)
>>> output = m(input)

FractionalMaxPool2d¶

文档

教程

资源