Video ResNet¶
VideoResNet 模型基于论文 A Closer Look at Spatiotemporal Convolutions for Action Recognition。
警告
视频模块处于 Beta 阶段,不保证向后兼容性。
模型构建器¶
可以使用以下模型构建器实例化 VideoResNet 模型,可选择使用或不使用预训练权重。所有模型构建器内部都依赖于 torchvision.models.video.resnet.VideoResNet
基类。有关此类的更多详细信息,请参阅 源代码。
|
构建 18 层 Resnet3D 模型。 |
|
构建 18 层混合卷积网络,如(论文中)。 |
|
构建 18 层深度 R(2+1)D 网络,如(论文中)。 |