python_deploy.md 1.5 KB

Python部署

PaddleX已经集成了基于Python的高性能预测接口,在安装PaddleX后,可参照如下代码示例,进行预测。

部署模型导出

在服务端部署模型时需要将训练过程中保存的模型导出为inference格式模型,具体的导出步骤请参考文档部署模型导出将模型导出为inference格式。

预测部署

接下来的预测部署将使用PaddleX python高性能预测接口,接口说明可参考paddlex.deploy

  • 单张图片预测

    import paddlex as pdx
    predictor = pdx.deploy.Predictor('./inference_model')
    result = predictor.predict(img_file='test.img')
    
    
  • 单张图片预测、并评估预测速度

关于预测速度的说明:加载模型后,前几张图片的预测速度会较慢,这是因为运行启动时涉及到内存显存初始化等步骤,通常在预测20-30张图片后模型的预测速度达到稳定。如果需要评估预测速度,可通过指定预热轮数warmup_iters完成预热为获得更加精准的预测速度,可指定repeats重复预测后取时间平均值

import paddlex as pdx
predictor = pdx.deploy.Predictor('./inference_model')
result = predictor.predict(img_file='test.img',
                           warmup_iters=100,
                           repeats=100)

  • 批量图片预测

    import paddlex as pdx
    predictor = pdx.deploy.Predictor('./inference_model')
    image_list = ['test1.jpg', 'test2.jpg']
    result = predictor.batch_predict(img_file=image_list)