comments: true

PaddleX 3.0 产线部署教程

在使用本教程之前，您首先需要安装 PaddleX，安装方式请参考 PaddleX 安装。

PaddleX 的三种部署方式详细说明如下：

高性能推理：在实际生产环境中，许多应用对部署策略的性能指标（尤其是响应速度）有着较严苛的标准，以确保系统的高效运行与用户体验的流畅性。为此，PaddleX 提供高性能推理插件，旨在对模型推理及前后处理进行深度性能优化，实现端到端流程的显著提速，详细的高性能推理流程请参考 PaddleX 高性能推理指南。
服务化部署：服务化部署是实际生产环境中常见的一种部署形式。通过将推理功能封装为服务，客户端可以通过网络请求来访问这些服务，以获取推理结果。PaddleX 支持用户以低成本实现产线的服务化部署，详细的服务化部署流程请参考 PaddleX 服务化部署指南。
端侧部署：端侧部署是一种将计算和数据处理功能放在用户设备本身上的方式，设备可以直接处理数据，而不需要依赖远程的服务器。PaddleX 支持将模型部署在 Android 等端侧设备上，详细的端侧部署流程请参考 PaddleX端侧部署指南。

本教程将举三个实际应用例子，来依次介绍 PaddleX 的三种部署方式。

1 高性能推理示例

1.1 获取序列号与激活

在飞桨AI Studio星河社区-人工智能学习与实训社区页面的“开源模型产线部署序列号咨询与获取”部分选择“立即获取”，如下图所示：

选择需要部署的产线，并点击“获取”。之后，可以在页面下方的“开源产线部署SDK序列号管理”部分找到获取到的序列号：

使用序列号完成激活后，即可使用高性能推理插件。PaddleX 提供离线激活和在线激活两种方式（均只支持 Linux 系统）：

联网激活：在使用推理 API 或 CLI 时，通过参数指定序列号及联网激活，使程序自动完成激活。
离线激活：按照序列号管理界面中的指引（点击“操作”中的“离线激活”），获取机器的设备指纹，并将序列号与设备指纹绑定以获取证书，完成激活。使用这种激活方式，需要手动将证书存放在机器的 ${HOME}/.baidu/paddlex/licenses 目录中（如果目录不存在，需要创建目录），并在使用推理 API 或 CLI 时指定序列号。请注意：每个序列号只能绑定到唯一的设备指纹，且只能绑定一次。这意味着用户如果使用不同的机器部署模型，则必须为每台机器准备单独的序列号。

1.2 安装高性能推理插件

在下表中根据处理器架构、操作系统、设备类型、Python 版本等信息，找到对应的安装指令并在部署环境中执行：

处理器架构	操作系统	设备类型	Python 版本	安装指令
x86-64	Linux	CPU
			3.8	curl -s https://paddle-model-ecology.bj.bcebos.com/paddlex/PaddleX3.0/deploy/paddlex_hpi/install_script/latest/install_paddlex_hpi.py \| python3.8 - --arch x86_64 --os linux --device cpu --py 38
			3.9	curl -s https://paddle-model-ecology.bj.bcebos.com/paddlex/PaddleX3.0/deploy/paddlex_hpi/install_script/latest/install_paddlex_hpi.py \| python3.9 - --arch x86_64 --os linux --device cpu --py 39
			3.10	curl -s https://paddle-model-ecology.bj.bcebos.com/paddlex/PaddleX3.0/deploy/paddlex_hpi/install_script/latest/install_paddlex_hpi.py \| python3.10 - --arch x86_64 --os linux --device cpu --py 310
		GPU （CUDA 11.8 + cuDNN 8.6）	3.8	curl -s https://paddle-model-ecology.bj.bcebos.com/paddlex/PaddleX3.0/deploy/paddlex_hpi/install_script/latest/install_paddlex_hpi.py \| python3.8 - --arch x86_64 --os linux --device gpu_cuda118_cudnn86 --py 38
			3.9	curl -s https://paddle-model-ecology.bj.bcebos.com/paddlex/PaddleX3.0/deploy/paddlex_hpi/install_script/latest/install_paddlex_hpi.py \| python3.9 - --arch x86_64 --os linux --device gpu_cuda118_cudnn86 --py 39
			3.10	curl -s https://paddle-model-ecology.bj.bcebos.com/paddlex/PaddleX3.0/deploy/paddlex_hpi/install_script/latest/install_paddlex_hpi.py \| python3.10 - --arch x86_64 --os linux --device gpu_cuda118_cudnn86 --py 310

当设备类型为 GPU 时，请使用与环境匹配的 CUDA 和 cuDNN 版本对应的安装指令，否则，将无法正常使用高性能推理插件。
对于 Linux 系统，使用 Bash 执行安装指令。
当设备类型为 CPU 时，安装的高性能推理插件仅支持使用 CPU 进行推理；对于其他设备类型，安装的高性能推理插件则支持使用 CPU 或其他设备进行推理。

1.3 启用高性能推理插件

在启用高性能插件前，请确保当前环境的 LD_LIBRARY_PATH 没有指定 TensorRT 的共享库目录，因为插件中已经集成了 TensorRT，避免 TensorRT 版本冲突导致插件无法正常使用。

对于 PaddleX CLI，指定 --use_hpip，并设置序列号，即可启用高性能推理插件。如果希望进行联网激活，在第一次使用序列号时，需指定 --update_license，以通用OCR产线为例：

paddlex \
    --pipeline OCR \
    --input https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_ocr_002.png \
    --device gpu:0 \
    --use_hpip \
    --serial_number {序列号}

# 如果希望进行联网激活
paddlex \
    --pipeline OCR \
    --input https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_ocr_002.png \
    --device gpu:0 \
    --use_hpip \
    --update_license \
    --serial_number {序列号}

对于 PaddleX Python API，启用高性能推理插件的方法类似。仍以通用OCR产线为例：

from paddlex import create_pipeline

pipeline = create_pipeline(
    pipeline="OCR",
    use_hpip=True,
    hpi_params={"serial_number": xxx}
)

output = pipeline.predict("https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_ocr_002.png ")

启用高性能推理插件得到的推理结果与未启用插件时一致。对于部分模型，在首次启用高性能推理插件时，可能需要花费较长时间完成推理引擎的构建。PaddleX 将在推理引擎的第一次构建完成后将相关信息缓存在模型目录，并在后续复用缓存中的内容以提升初始化速度。

1.4 推理步骤

本推理步骤基于 PaddleX CLI、联网激活序列号、Python 3.10.0、设备类型为CPU 的方式使用高性能推理插件，其他使用方式（如不同 Python 版本、设备类型或 PaddleX Python API）可参考 PaddleX 高性能推理指南替换相应的指令。

# 安装高性能推理插件
curl -s https://paddle-model-ecology.bj.bcebos.com/paddlex/PaddleX3.0/deploy/paddlex_hpi/install_script/latest/install_paddlex_hpi.py | python3.10 - --arch x86_64 --os linux --device cpu --py 310
# 确保当前环境的 `LD_LIBRARY_PATH` 没有指定 TensorRT 的共享库目录 可以使用下面命令去除或手动去除
export LD_LIBRARY_PATH=$(echo $LD_LIBRARY_PATH | tr ':' '\n' | grep -v TensorRT | tr '\n' ':' | sed 's/:*$//')
# 执行推理
paddlex --pipeline OCR --input https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_ocr_002.png --device gpu:0 --use_hpip --serial_number {序列号} --update_license True --save_path ./output

运行结果：

1.5 更换产线或模型

更换产线：

若想更换其他产线使用高性能推理插件，则替换 --pipeline 传入的值即可，以下以通用目标检测产线为例：

  paddlex --pipeline object_detection --input https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_object_detection_002.png --device gpu:0 --use_hpip --serial_number {序列号} --update_license True --save_path ./output

更换模型：

OCR 产线默认使用 PP-OCRv4_mobile_det、PP-OCRv4_mobile_rec 模型，若想更换其他模型，如 PP-OCRv4_server_det、PP-OCRv4_server_rec 模型，可参考通用OCR产线使用教程，具体操作如下：

  # 1. 获取 OCR 产线配置文件并保存到 ./OCR.yaml
  paddlex --get_pipeline_config OCR --save_path ./OCR.yaml

  # 2. 修改 ./OCR.yaml 配置文件
  #    将 Pipeline.text_det_model 的值改为 PP-OCRv4_server_det 模型所在路径
  #    将 Pipeline.text_rec_model 的值改为 PP-OCRv4_server_rec 模型所在路径

  # 3. 执行推理时使用修改后的配置文件
  paddlex --pipeline ./OCR.yaml --input https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_ocr_002.png --device gpu:0 --use_hpip --serial_number {序列号} --update_license True --save_path ./output

通用目标检测产线默认使用 PicoDet-S 模型，若想更换其他模型，如 RT-DETR 模型，可参考通用目标检测产线使用教程，具体操作如下：

  # 1. 获取 OCR 产线配置文件并保存到 ./object_detection.yaml
  paddlex --get_pipeline_config object_detection --save_path ./object_detection.yaml

  # 2. 修改 ./object_detection.yaml 配置文件
  #    将 Pipeline.model 的值改为 RT-DETR 模型所在路径

  # 3. 执行推理时使用修改后的配置文件
  paddlex --pipeline ./object_detection.yaml --input https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_ocr_002.png --device gpu:0 --use_hpip --serial_number {序列号} --update_license True --save_path ./output

其他产线的操作与上述两条产线的操作类似，更多细节可参考产线使用教程。

2 服务化部署示例

2.1 安装服务化部署插件

执行如下指令，安装服务化部署插件：

paddlex --install serving

2.2 启动服务

通过 PaddleX CLI 启动服务，指令格式为：

paddlex --serve --pipeline {产线名称或产线配置文件路径} [{其他命令行选项}]

以通用OCR产线为例：

paddlex --serve --pipeline OCR

服务启动成功后，可以看到类似如下展示的信息：

INFO:     Started server process [63108]
INFO:     Waiting for application startup.
INFO:     Application startup complete.
INFO:     Uvicorn running on http://0.0.0.0:8080 (Press CTRL+C to quit)

--pipeline 可指定为官方产线名称或本地产线配置文件路径。PaddleX 以此构建产线并部署为服务。如需调整配置（如模型路径、batch_size、部署设备等），请参考通用OCR产线使用教程中的 “模型应用” 部分。与服务化部署相关的命令行选项如下：

名称	说明
`--pipeline`	产线名称或产线配置文件路径。
`--device`	产线部署设备。默认为 `cpu`（如 GPU 不可用）或 `gpu`（如 GPU 可用）。
`--host`	服务器绑定的主机名或 IP 地址。默认为0.0.0.0。
`--port`	服务器监听的端口号。默认为8080。
`--use_hpip`	如果指定，则启用高性能推理插件。
`--serial_number`	高性能推理插件使用的序列号。只在启用高性能推理插件时生效。请注意，并非所有产线、模型都支持使用高性能推理插件，详细的支持情况请参考PaddleX 高性能推理指南。
`--update_license`	如果指定，则进行联网激活。只在启用高性能推理插件时生效。

2.3 调用服务

此处只展示 Python 调用示例，API参考和其他语言服务调用示例可参考 PaddleX服务化部署指南的 1.3 调用服务 中各产线使用教程的 “开发集成/部署” 部分。

import base64
import requests

API_URL = "http://localhost:8080/ocr" # 服务URL
image_path = "./demo.jpg"
output_image_path = "./out.jpg"

# 对本地图像进行Base64编码
with open(image_path, "rb") as file:
    image_bytes = file.read()
    image_data = base64.b64encode(image_bytes).decode("ascii")

payload = {"image": image_data}  # Base64编码的文件内容或者图像URL

# 调用API
response = requests.post(API_URL, json=payload)

# 处理接口返回数据
assert response.status_code == 200
result = response.json()["result"]
with open(output_image_path, "wb") as file:
    file.write(base64.b64decode(result["image"]))
print(f"Output image saved at {output_image_path}")
print("\nDetected texts:")
print(result["texts"])

2.4 部署步骤

# 安装服务化部署插件
paddlex --install serving
# 启动服务
paddlex --serve --pipeline OCR
# 调用服务 | fast_test.py 中代码为上一节的 Python 调用示例
wget https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_ocr_002.png -O demo.jpg
python fast_test.py

运行结果：

2.5 更换产线或模型

更换产线：

若想更换其他产线进行服务化部署，则替换 --pipeline 传入的值即可，以下以通用目标检测产线为例：

  paddlex --serve --pipeline object_detection

更换模型：

  # 1. 获取 OCR 产线配置文件并保存到 ./OCR.yaml
  paddlex --get_pipeline_config OCR --save_path ./OCR.yaml

  # 2. 修改 ./OCR.yaml 配置文件
  #    将 Pipeline.text_det_model 的值改为 PP-OCRv4_server_det 模型所在路径
  #    将 Pipeline.text_rec_model 的值改为 PP-OCRv4_server_rec 模型所在路径

  # 3. 启动服务时使用修改后的配置文件
  paddlex --serve --pipeline ./OCR.yaml
  # 4. 调用服务
  wget https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_ocr_002.png -O demo.jpg
  python fast_test.py

通用目标检测产线默认使用 PicoDet-S 模型，若想更换其他模型，如 RT-DETR 模型，可参考通用目标检测产线使用教程，具体操作如下：

  # 1. 获取 OCR 产线配置文件并保存到 ./object_detection.yaml
  paddlex --get_pipeline_config object_detection --save_path ./object_detection.yaml

  # 2. 修改 ./object_detection.yaml 配置文件
  #    将 Pipeline.model 的值改为 RT-DETR 模型所在路径

  # 3. 启动服务时使用修改后的配置文件
  paddlex --serve --pipeline ./object_detection.yaml
  # 4. 调用服务 | fast_test.py 需要替换为通用目标检测产线使用教程中的 Python 调用示例
  wget https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_ocr_002.png -O demo.jpg
  python fast_test.py

其他产线的操作与上述两条产线的操作类似，更多细节可参考产线使用教程。

3 端侧部署示例

3.1 环境准备

在本地环境安装好 CMake 编译工具，并在 Android NDK 官网下载当前系统符合要求的版本的 NDK 软件包。例如，在 Mac 上开发，需要在 Android NDK 官网下载 Mac 平台的 NDK 软件包。

环境要求
- CMake >= 3.10（最低版本未经验证，推荐 3.20 及以上）
- Android NDK >= r17c（最低版本未经验证，推荐 r20b 及以上）
本指南所使用的测试环境：
- cmake == 3.20.0
- android-ndk == r20b
准备一部 Android 手机，并开启 USB 调试模式。开启方法: 手机设置 -> 查找开发者选项 -> 打开开发者选项和 USB 调试模式。
电脑上安装 ADB 工具，用于调试。ADB 安装方式如下：

3.1. Mac 电脑安装 ADB
```
 brew cask install android-platform-tools
```
3.2. Linux 安装 ADB
```
 # debian系linux发行版的安装方式
 sudo apt update
 sudo apt install -y wget adb

 # redhat系linux发行版的安装方式
 sudo yum install adb
```
3.3. Windows 安装 ADB

win 上安装需要去谷歌的安卓平台下载 ADB 软件包进行安装：链接

打开终端，手机连接电脑，在终端中输入
```
 adb devices
```
如果有 device 输出，则表示安装成功。
```
 List of devices attached
 744be294    device
```

3.2 物料准备

克隆 Paddle-Lite-Demo 仓库的 feature/paddle-x 分支到 PaddleX-Lite-Deploy 目录。

git clone -b feature/paddle-x https://github.com/PaddlePaddle/Paddle-Lite-Demo.git PaddleX-Lite-Deploy

填写问卷下载压缩包，将压缩包放到指定解压目录，切换到指定解压目录后执行解压命令。

  # 1. 切换到指定解压目录
  cd PaddleX-Lite-Deploy/ocr/android/shell/ppocr_demo

  # 2. 执行解压命令
  unzip ocr.zip

3.3 部署步骤

将工作目录切换到 PaddleX-Lite-Deploy/libs 目录，运行 download.sh 脚本，下载需要的 Paddle Lite 预测库。此步骤只需执行一次，即可支持每个 demo 使用。
将工作目录切换到 PaddleX-Lite-Deploy/ocr/assets 目录，运行 download.sh 脚本，下载 paddle_lite_opt 工具优化后的模型文件。
将工作目录切换到 PaddleX-Lite-Deploy/ocr/android/shell/cxx/ppocr_demo 目录，运行 build.sh 脚本，完成可执行文件的编译。
将工作目录切换到 PaddleX-Lite-Deploy/ocr/android/shell/cxx/ppocr_demo，运行 run.sh 脚本，完成在端侧的预测。

注意事项：

在运行 build.sh 脚本前，需要更改 NDK_ROOT 指定的路径为实际安装的 NDK 路径。
在 Windows 系统上可以使用 Git Bash 执行部署步骤。
若在 Windows 系统上编译，需要将 CMakeLists.txt 中的 CMAKE_SYSTEM_NAME 设置为 windows。
若在 Mac 系统上编译，需要将 CMakeLists.txt 中的 CMAKE_SYSTEM_NAME 设置为 darwin。
在运行 run.sh 脚本时需保持 ADB 连接。
download.sh 和 run.sh 支持传入参数来指定模型，若不指定则默认使用 PP-OCRv4_mobile 模型。目前适配了 2 个模型：
- PP-OCRv3_mobile
- PP-OCRv4_mobile

以下为实际操作时的示例：

 # 1. 下载需要的 Paddle Lite 预测库
 cd PaddleX-Lite-Deploy/libs
 sh download.sh

 # 2. 下载 paddle_lite_opt 工具优化后的模型文件
 cd ../ocr/assets
 sh download.sh PP-OCRv4_mobile

 # 3. 完成可执行文件的编译
 cd ../android/shell/ppocr_demo
 sh build.sh

# 4. 预测
 sh run.sh PP-OCRv4_mobile

检测结果：

识别结果：

The detection visualized image saved in ./test_img_result.jpg
0       纯臻营养护发素  0.993706
1       产品信息/参数   0.991224
2       （45元/每公斤，100公斤起订）    0.938893
3       每瓶22元，1000瓶起订）  0.988353
4       【品牌】：代加工方式/OEMODM     0.97557
5       【品名】：纯臻营养护发素        0.986914
6       ODMOEM  0.929891
7       【产品编号】：YM-X-3011 0.964156
8       【净含量】：220ml       0.976404
9       【适用人群】：适合所有肤质      0.987942
10      【主要成分】：鲸蜡硬脂醇、燕麦β-葡聚    0.968315
11      糖、椰油酰胺丙基甜菜碱、泛醒    0.941537
12      （成品包材）    0.974796
13      【主要功能】：可紧致头发磷层，从而达到  0.988799
14      即时持久改善头发光泽的效果，给干燥的头  0.989547
15      发足够的滋养    0.998413

deployment_tutorial.md 22 KB 文件歷史 原始文件