除了 模型产线推理 Python API 文档 中介绍的模型产线部署方案外,PaddleX 还提供基于全场景、多后端推理工具 FastDeploy 的部署方案。基于 FastDeploy 的部署方案支持更多后端,并且提供高性能推理和服务化部署两种部署方式,能够满足更多场景的需求:
请注意,目前并非所有产线、所有模型都支持基于 FastDeploy 的部署,具体支持情况请参考 支持 FastDeploy 部署的产线与模型。
model 目录中的模型。需注意模型与产线模块的对应关系,并且不要修改 model 的目录结构。offline_sdk 目录对应高性能推理SDK,serving_sdk 目录对应服务化部署SDK。按照SDK文档(README.md)中的说明,完成产线的本地部署。| 模型产线 | 产线模块 | 具体模型 |
|---|---|---|
| 通用图像分类 | 图像分类 | CLIP_vit_base_patch16_224 CLIP_vit_large_patch14_224 moreConvNeXt_tiny MobileNetV2_x0_25 MobileNetV2_x0_5 MobileNetV2_x1_0 MobileNetV2_x1_5 MobileNetV2_x2_0 MobileNetV3_large_x0_35 MobileNetV3_large_x0_5 MobileNetV3_large_x0_75 MobileNetV3_large_x1_0 MobileNetV3_large_x1_25 MobileNetV3_small_x0_35 MobileNetV3_small_x0_5 MobileNetV3_small_x0_75 MobileNetV3_small_x1_0 MobileNetV3_small_x1_25 PP-HGNet_small PP-HGNetV2-B0 PP-HGNetV2-B4 PP-HGNetV2-B6 PP-LCNet_x0_25 PP-LCNet_x0_35 PP-LCNet_x0_5 PP-LCNet_x0_75 PP-LCNet_x1_0 PP-LCNet_x1_5 PP-LCNet_x2_0 PP-LCNet_x2_5 ResNet18 ResNet34 ResNet50 ResNet101 ResNet152 |
| 通用目标检测 | 目标检测 | PicoDet-S PicoDet-L morePP-YOLOE_plus-S PP-YOLOE_plus-M PP-YOLOE_plus-L PP-YOLOE_plus-X |
| 通用语义分割 | 语义分割 | OCRNet_HRNet-W48 PP-LiteSeg-T moreDeeplabv3-R50 Deeplabv3-R101 Deeplabv3_Plus-R50 Deeplabv3_Plus-R101 |
| 通用 OCR | 文本检测 | PP-OCRv4_mobile_det PP-OCRv4_server_det |
| 文本识别 | PP-OCRv4_mobile_rec PP-OCRv4_server_rec |