算子¶
torchvision.ops
实现了计算机视觉特定的算子、损失函数和层。
注意
所有算子都原生支持 TorchScript。
检测与分割算子¶
以下算子执行目标检测和分割模型所需的前处理和后处理。
|
批量执行非极大值抑制。 |
|
计算给定掩码周围的边界框。 |
|
根据边界框的交并比 (IoU) 对边界框执行非极大值抑制 (NMS)。 |
|
执行 Mask R-CNN 中描述的使用平均池化的感兴趣区域 (RoI) 对齐算子。 |
|
执行 Fast R-CNN 中描述的感兴趣区域 (RoI) 池化算子 |
|
执行 Light-Head R-CNN 中提到的位置敏感感兴趣区域 (RoI) 对齐算子。 |
|
执行 R-FCN 中描述的位置敏感感兴趣区域 (RoI) 池化算子 |
|
在特征图集合之上添加 FPN 的模块。 |
|
多尺度 RoIAlign 池化,对于有无 FPN 的检测都很有用。 |
|
参见 |
|
参见 |
|
参见 |
|
参见 |
边界框算子¶
这些工具函数对边界框执行各种操作。
|
计算一组边界框的面积,这些边界框由其 (x1, y1, x2, y2) 坐标指定。 |
|
将 |
|
返回两组边界框之间的交并比 (Jaccard index)。 |
|
裁剪边界框,使其位于大小为 |
|
返回两组边界框之间的完全交并比 (Jaccard index)。 |
|
返回两组边界框之间的距离交并比 (Jaccard index)。 |
|
返回两组边界框之间的广义交并比 (Jaccard index)。 |
|
移除 |
损失函数¶
实现了以下计算机视觉特定的损失函数
|
梯度友好的 IoU 损失,并在边界框不重叠时施加额外的非零惩罚。 |
|
梯度友好的 IoU 损失,并在边界框中心之间的距离不为零时施加额外的非零惩罚。 |
|
梯度友好的 IoU 损失,并在边界框不重叠时施加额外的非零惩罚,惩罚大小随最小外接框的尺寸变化。 |
|
RetinaNet 中用于密集检测的损失函数:https://arxiv.org/abs/1708.02002。 |
层¶
TorchVision 提供了常用的构建块作为层
|
用于 Convolution2d-Normalization-Activation 块的可配置模块。 |
|
用于 Convolution3d-Normalization-Activation 块的可配置模块。 |
|
参见 |
|
参见 |
|
参见 |
|
批次统计量和仿射参数固定的 BatchNorm2d |
|
此块实现了多层感知器 (MLP) 模块。 |
|
此模块返回张量输入的视图,其维度已进行排列。 |
|
此块实现了来自 https://arxiv.org/abs/1709.01507 的 Squeeze-and-Excitation 块(参见图。 |
|
|
如果 |
|
实现了来自 《DropBlock:一种用于卷积网络的正则化方法》 <https://arxiv.org/abs/1810.12890> 的 DropBlock2d。 |
|
实现了来自 《DropBlock:一种用于卷积网络的正则化方法》 <https://arxiv.org/abs/1810.12890> 的 DropBlock3d。 |
|
实现了来自 《带有随机深度的深度网络》的随机深度,用于随机丢弃残差架构的残差分支。 |