运算符¶
torchvision.ops
实现特定于计算机视觉的运算符、损失和层。
注意
所有运算符都对 TorchScript 提供原生支持。
检测和分割运算符¶
以下运算符执行目标检测和分割模型中所需的预处理和后处理。
|
以批处理方式执行非最大抑制。 |
|
计算提供的掩码周围的边界框。 |
|
根据其交集超过并集 (IoU) 对框执行非最大抑制 (NMS)。 |
|
使用平均池化执行兴趣区域 (RoI) 对齐运算符,如 Mask R-CNN 中所述。 |
|
执行 Fast R-CNN 中描述的兴趣区域 (RoI) 池化运算符 |
|
执行 Light-Head R-CNN 中提到的位置敏感兴趣区域 (RoI) 对齐运算符。 |
|
执行 R-FCN 中描述的位置敏感兴趣区域 (RoI) 池化运算符 |
|
在多个特征映射之上添加 FPN 的模块。 |
|
多尺度 RoIAlign 池化,对于有或没有 FPN 的检测很有用。 |
|
见 |
|
见 |
|
|
|
框运算符¶
这些实用程序函数对边界框执行各种操作。
|
计算一组边界框的面积,这些边界框由其 (x1, y1, x2, y2) 坐标指定。 |
|
将 |
|
返回两组框之间的交集超过并集 (Jaccard 指数)。 |
|
裁剪框,使其位于大小为 |
|
返回两组框之间的完整交集超过并集 (Jaccard 指数)。 |
|
返回两组框之间的距离交集超过并集 (Jaccard 指数)。 |
|
返回两组框之间的广义交集超过并集 (Jaccard 指数)。 |
|
从 |
损失¶
实现了以下特定于视觉的损失函数
|
梯度友好的 IoU 损失,当框不重叠时,具有额外的非零惩罚。 |
|
梯度友好的 IoU 损失,当框中心的距离不为零时,具有额外的非零惩罚。 |
|
梯度友好的 IoU 损失,当框不重叠时,具有额外的非零惩罚,并根据其最小外接框的大小进行缩放。 |
|
RetinaNet 中用于密集检测的损失函数:https://arxiv.org/abs/1708.02002. |
层¶
TorchVision 提供了常用的构建块作为层
|
用于卷积 2D - 归一化 - 激活块的可配置块。 |
|
用于卷积 3D - 归一化 - 激活块的可配置块。 |
|
参见 |
|
参见 |
|
参见 |
|
BatchNorm2d,其中批次统计信息和仿射参数是固定的 |
|
此模块实现了多层感知器 (MLP) 模块。 |
|
此模块返回张量输入的视图,其维度已置换。 |
|
此模块实现了来自 https://arxiv.org/abs/1709.01507 的 Squeeze-and-Excitation 块(参见图。 |
|
|
执行可变形卷积 v2,如 可变形卷积网络 v2:更可变形,更好的结果 中所述,如果 |
|
从 "DropBlock:一种卷积网络正则化方法" <https://arxiv.org/abs/1810.12890> 中实现 DropBlock2d。 |
|
从 "DropBlock:一种卷积网络正则化方法" <https://arxiv.org/abs/1810.12890> 中实现 DropBlock3d。 |
|
从 "具有随机深度的深度网络" 中实现了随机深度,用于随机丢弃残差架构的残差分支。 |