借助PaddleHub-Serving,可以将PaddleX的Inference Model进行快速部署,以提供在线预测的能力。
关于PaddleHub-Serving的更多信息,可参照PaddleHub-Serving。
注意:使用此方式部署,需确保自己Python环境中PaddleHub的版本高于1.8.0, 可在命令终端输入pip show paddlehub确认版本信息。
下面,我们按照步骤,实现将一个图像分类模型MobileNetV3_small_ssld转换成PaddleHub的预训练模型,并利用PaddleHub-Serving实现一键部署。
部署模型的格式均为目录下包含__model__,__params__和model.yml三个文件,如若不然,则参照部署模型导出文档进行导出。
首先,我们将PaddleX的Inference Model转换成PaddleHub的预训练模型,使用命令hub convert即可一键转换,对此命令的说明如下:
$ hub convert --model_dir XXXX \
--module_name XXXX \
--module_version XXXX \
--output_dir XXXX
参数:
|参数|用途|
|-|-|
|--model_dir/-m|PaddleX Inference Model所在的目录|
|--module_name/-n|生成预训练模型的名称|
|--module_version/-v|生成预训练模型的版本,默认为1.0.0|
|--output_dir/-o|生成预训练模型的存放位置,默认为{module_name}_{timestamp}|
因此,我们仅需要一行命令即可完成预训练模型的转换。
hub convert --model_dir mobilenetv3_small_ssld_imagenet_hub --module_name mobilenetv3_small_ssld_imagenet_hub
转换成功后会打印提示信息,如下:
$ The converted module is stored in `MobileNetV3_small_ssld_hub_1596077881.868501`.
等待生成成功的提示后,我们就在输出目录中得到了一个PaddleHub的一个预训练模型。
在模型转换一步中,我们得到了一个.tar.gz格式的预训练模型压缩包,在进行部署之前需要先安装到本机,使用命令hub install即可一键安装,对此命令的说明如下:
$ hub install ${MODULE}
其中${MODULE}为要安装的预训练模型文件路径。
因此,我们使用hub install命令安装:
hub install MobileNetV3_small_ssld_hub_1596077881.868501/mobilenetv3_small_ssld_imagenet_hub.tar.gz
安装成功后会打印提示信息,如下:
$ Successfully installed mobilenetv3_small_ssld_imagenet_hub
下面,我们只需要使用hub serving命令即可完成模型的一键部署,对此命令的说明如下:
$ hub serving start --modules/-m [Module1==Version1, Module2==Version2, ...] \
--port/-p XXXX
--config/-c XXXX
参数:
|参数|用途|
|-|-|
|--modules/-m|PaddleHub Serving预安装模型,以多个Module==Version键值对的形式列出当不指定Version时,默认选择最新版本|
|--port/-p|服务端口,默认为8866|
|--config/-c|使用配置文件配置模型|
因此,我们仅需要一行代码即可完成模型的部署,如下:
$ hub serving start -m mobilenetv3_small_ssld_imagenet_hub
等待模型加载后,此预训练模型就已经部署在机器上了。
我们还可以使用配置文件对部署的模型进行更多配置,配置文件格式如下:
{
"modules_info": {
"mobilenetv3_small_ssld_imagenet_hub": {
"init_args": {
"version": "1.0.0"
},
"predict_args": {
"batch_size": 1,
"use_gpu": false
}
}
},
"port": 8866
}
|参数|用途|
|-|-|
|modules_info|PaddleHub Serving预安装模型,以字典列表形式列出,key为模型名称。其中:init_args为模型加载时输入的参数,等同于paddlehub.Module(**init_args)predict_args为模型预测时输入的参数,以mobilenetv3_small_ssld_imagenet_hub为例,等同于mobilenetv3_small_ssld_imagenet_hub.batch_predict(**predict_args)
|port|服务端口,默认为8866|
在第二步模型安装的同时,会生成一个客户端请求示例,存放在模型安装目录,默认为${HUB_HOME}/.paddlehub/modules,对于此例,我们可以在~/.paddlehub/modules/mobilenetv3_small_ssld_imagenet_hub找到此客户端示例serving_client_demo.py,代码如下:
# coding: utf8
import requests
import json
import cv2
import base64
def cv2_to_base64(image):
data = cv2.imencode('.jpg', image)[1]
return base64.b64encode(data.tostring()).decode('utf8')
if __name__ == '__main__':
# 获取图片的base64编码格式
img1 = cv2_to_base64(cv2.imread("IMAGE_PATH1"))
img2 = cv2_to_base64(cv2.imread("IMAGE_PATH2"))
data = {'images': [img1, img2]}
# 指定content-type
headers = {"Content-type": "application/json"}
# 发送HTTP请求
url = "http://127.0.0.1:8866/predict/mobilenetv3_small_ssld_imagenet_hub"
r = requests.post(url=url, headers=headers, data=json.dumps(data))
# 打印预测结果
print(r.json()["results"])
使用的测试图片如下:
将代码中的IMAGE_PATH1改成想要进行预测的图片路径后,在命令行执行:
python ~/.paddlehub/module/MobileNetV3_small_ssld_hub/serving_client_demo.py
即可收到预测结果,如下:
shell
[[{'category': 'envelope', 'category_id': 549, 'score': 0.2141510397195816}]]
`
到此,我们就完成了PaddleX模型的一键部署。