| 模型 |
Mask AP |
GPU推理耗时(ms) |
CPU推理耗时 (ms) |
模型存储大小(M) |
介绍 |
| Cascade-MaskRCNN-ResNet50-FPN |
36.3 |
- |
- |
254.8 M |
Cascade-MaskRCNN 是一种改进的Mask RCNN实例分割模型,通过级联多个检测器,利用不同IOU阈值优化分割结果,解决检测与推理阶段的mismatch问题,提高了实例分割的准确性。 |
| Cascade-MaskRCNN-ResNet50-vd-SSLDv2-FPN |
39.1 |
- |
- |
254.7 M |
| Mask-RT-DETR-H |
50.6 |
132.693 |
4896.17 |
449.9 M |
Mask-RT-DETR 是一种基于RT-DETR的实例分割模型,通过采用最优性能的更好的PP-HGNetV2作为骨干网络,构建了MaskHybridEncoder编码器,引入了IOU-aware Query Selection 技术,使其在相同推理耗时上取得了SOTA实例分割精度。 |
| Mask-RT-DETR-L |
45.7 |
46.5059 |
2575.92 |
113.6 M |
| Mask-RT-DETR-M |
42.7 |
36.8329 |
- |
66.6 M |
| Mask-RT-DETR-S |
41.0 |
33.5007 |
- |
51.8 M |
| Mask-RT-DETR-X |
47.5 |
75.755 |
3358.04 |
237.5 M |
| MaskRCNN-ResNet50-FPN |
35.6 |
- |
- |
157.5 M |
Mask R-CNN是由华盛顿首例即现投影卡的一个全任务深度学习模型,能够在一个模型中完成图片实例的分类和定位,并结合图像级的遮罩(Mask)来完成分割任务。 |
| MaskRCNN-ResNet50-vd-FPN |
36.4 |
- |
- |
157.5 M |
| MaskRCNN-ResNet50 |
32.8 |
- |
- |
128.7 M |
| MaskRCNN-ResNet101-FPN |
36.6 |
- |
- |
225.4 M |
| MaskRCNN-ResNet101-vd-FPN |
38.1 |
- |
- |
225.1 M |
| MaskRCNN-ResNeXt101-vd-FPN |
39.5 |
- |
- |
370.0 M |
|
| PP-YOLOE_seg-S |
32.5 |
- |
- |
31.5 M |
PP-YOLOE_seg 是一种基于PP-YOLOE的实例分割模型。该模型沿用了PP-YOLOE的backbone和head,通过设计PP-YOLOE实例分割头,大幅提升了实例分割的性能和推理速度。 |
| SOLOv2 |
35.5 |
- |
- |
179.1 M |
SOLOv2 是一种按位置分割物体的实时实例分割算法。该模型是SOLO的改进版本,通过引入掩码学习和掩码NMS,实现了精度和速度上取得良好平衡。 |
**注:以上精度指标为[COCO2017](https://cocodataset.org/#home)验证集 Mask AP。所有模型 GPU 推理耗时基于 NVIDIA Tesla T4 机器,精度类型为 FP32, CPU 推理速度基于 Intel(R) Xeon(R) Gold 5117 CPU @ 2.00GHz,线程数为8,精度类型为 FP32。**