快捷方式

torch.nn.functional.conv2d

torch.nn.functional.conv2d(input, weight, bias=None, stride=1, padding=0, dilation=1, groups=1) Tensor

对由多个输入平面组成的输入图像应用 2D 卷积。

此运算符支持 TensorFloat32

有关详细信息和输出形状,请参见 Conv2d

注意

在某些情况下,当在 CUDA 设备上给定张量并使用 CuDNN 时,此运算符可能会选择非确定性算法以提高性能。如果不需要这样做,您可以尝试通过设置 torch.backends.cudnn.deterministic = True 使操作具有确定性(可能会牺牲性能)。有关更多信息,请参见 可重复性

注意

此运算符支持复数数据类型,即 complex32、 complex64、 complex128

参数
  • input – 形状为 (minibatch,in_channels,iH,iW)(\text{minibatch} , \text{in\_channels} , iH , iW) 的输入张量

  • weight – 形状为 (out_channels,in_channelsgroups,kH,kW)(\text{out\_channels} , \frac{\text{in\_channels}}{\text{groups}} , kH , kW) 的滤波器

  • bias – 可选的偏置张量,形状为 (out_channels)(\text{out\_channels})。默认值:None

  • stride – 卷积核的步幅。可以是单个数字或元组 (sH, sW)。默认值:1

  • padding

    输入两侧的隐式填充。可以是字符串 {'valid', 'same'}、单个数字或元组 (padH, padW)。默认值:0。 padding='valid' 与无填充相同。padding='same' 填充输入,使输出具有与输入相同的形状。但是,此模式不支持除 1 以外的任何步幅值。

    警告

    对于 padding='same',如果在任何维度上 weight 是偶数长度且 dilation 是奇数,则可能需要在内部进行完整的 pad() 操作。 降低性能。

  • dilation – 内核元素之间的间距。可以是单个数字或元组 (dH, dW)。默认值:1

  • groups – 将输入分成组,in_channels\text{in\_channels}out_channels\text{out\_channels} 都应能被组数整除。默认值:1

示例

>>> # With square kernels and equal stride
>>> filters = torch.randn(8, 4, 3, 3)
>>> inputs = torch.randn(1, 4, 5, 5)
>>> F.conv2d(inputs, filters, padding=1)

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取面向初学者和高级开发者的深度教程

查看教程

资源

查找开发资源并获得问题解答

查看资源