快捷方式

torch.nn.functional.fractional_max_pool3d

torch.nn.functional.fractional_max_pool3d(input, kernel_size, output_size=None, output_ratio=None, return_indices=False, _random_samples=None)

对由多个输入平面组成的输入信号应用 3D 分数最大池化。

分数最大池化在 Ben Graham 的论文 分数最大池化 中有详细描述。

最大池化运算在 kT×kH×kWkT \times kH \times kW 区域中应用,其随机步长由目标输出大小决定。输出特征的数量等于输入平面的数量。

参数
  • kernel_size – 要对其进行最大运算的窗口大小。可以是一个数字 kk(用于 k×k×kk \times k \times k 的方形内核)或元组 (kT, kH, kW)

  • output_size – 目标输出尺寸,格式为 oT×oH×oWoT \times oH \times oW。可以是元组 (oT, oH, oW),也可以是单个数字 oHoH,用于生成立方体输出 oH×oH×oHoH \times oH \times oH.

  • output_ratio – 如果希望输出尺寸与输入尺寸的比例相对应,则可以使用此选项。它必须是范围在 (0, 1) 内的数字或元组。

  • return_indices – 如果设置为 True,将返回索引以及输出。这对于传递给 max_unpool3d() 很有用。

形状
  • 输入: (N,C,Tin,Hin,Win)(N, C, T_{in}, H_{in}, W_{in})(C,Tin,Hin,Win)(C, T_{in}, H_{in}, W_{in}).

  • 输出:(N,C,Tout,Hout,Wout)(N, C, T_{out}, H_{out}, W_{out}) 或者 (C,Tout,Hout,Wout)(C, T_{out}, H_{out}, W_{out}), 其中 (Tout,Hout,Wout)=output_size(T_{out}, H_{out}, W_{out})=\text{output\_size} 或者 (Tout,Hout,Wout)=output_ratio×(Tin,Hin,Win)(T_{out}, H_{out}, W_{out})=\text{output\_ratio} \times (T_{in}, H_{in}, W_{in})

示例:
>>> input = torch.randn(20, 16, 50, 32, 16)
>>> # pool of cubic window of size=3, and target output size 13x12x11
>>> F.fractional_max_pool3d(input, 3, output_size=(13, 12, 11))
>>> # pool of cubic window and target output size being half of input size
>>> F.fractional_max_pool3d(input, 3, output_ratio=(0.5, 0.5, 0.5))

文档

获取 PyTorch 的完整开发人员文档

查看文档

教程

获取针对初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并获得问题的解答

查看资源