torch.nn.functional.conv2d¶
- torch.nn.functional.conv2d(input, weight, bias=None, stride=1, padding=0, dilation=1, groups=1) Tensor ¶
对由多个输入平面组成的输入图像应用二维卷积。
此操作符支持 TensorFloat32。
有关详细信息和输出形状,请参阅
Conv2d
。注意
在某些情况下,当在 CUDA 设备上给定张量并使用 CuDNN 时,此操作符可能会选择非确定性算法以提高性能。如果这是不希望的,您可以通过设置
torch.backends.cudnn.deterministic = True
来尝试使操作具有确定性(可能会牺牲性能)。有关更多信息,请参阅 可复现性。注意
此操作符支持复杂数据类型,即
complex32, complex64, complex128
。- 参数
input – 输入张量,形状为
weight – 过滤器,形状为
bias – 可选的偏置张量,形状为 。默认值:
None
stride – 卷积核的步长。可以是单个数字或元组 (sH, sW)。默认值: 1
padding –
输入两侧的隐式填充。可以是字符串 {'valid', 'same'},单个数字或元组 (padH, padW)。默认值: 0。
padding='valid'
等同于不填充。padding='same'
会填充输入,使得输出与输入的形状相同。但是,此模式不支持步长值除了 1 以外的任何值。警告
对于
padding='same'
,如果在任一维度上weight
长度为偶数且dilation
为奇数,内部可能需要完整的pad()
操作。这会降低性能。dilation – 卷积核元素之间的间距。可以是单个数字或元组 (dH, dW)。默认值: 1
groups – 将输入分成组, 和 都应能被组数整除。默认值: 1
示例
>>> # With square kernels and equal stride >>> filters = torch.randn(8, 4, 3, 3) >>> inputs = torch.randn(1, 4, 5, 5) >>> F.conv2d(inputs, filters, padding=1)