Sfoglia il codice sorgente

modify npu high performance docs (#3809)

a31413510 7 mesi fa
parent
commit
44fd0bd530
1 ha cambiato i file con 27 aggiunte e 27 eliminazioni
  1. 27 27
      docs/practical_tutorials/high_performance_npu_tutorial.md

+ 27 - 27
docs/practical_tutorials/high_performance_npu_tutorial.md

@@ -34,7 +34,7 @@ docker run -it --name paddle-npu-dev -v $(pwd):/work \
     -v /usr/local/bin/npu-smi:/usr/local/bin/npu-smi \
     -v /usr/local/dcmi:/usr/local/dcmi \
     -e ASCEND_RT_VISIBLE_DEVICES="0,1,2,3,4,5,6,7" \
-    ccr-2vdh3abv-pub.cnc.bj.baidubce.com/device/paddle-npu:cann80RC2-ubuntu20-npu-base-x86_64-gcc84 /bin/bash
+    ccr-2vdh3abv-pub.cnc.bj.baidubce.com/device/paddle-npu:cann800-ubuntu20-npu-910b-base-x86_64-gcc84 /bin/bash
 ```
 
 ## 2、安装PaddleX及高性能推理插件
@@ -54,10 +54,9 @@ pip install -e .
 * 推荐直接下载安装 PaddleX 官方提供的 whl 包
 
 ```bash
-# x86 架构
-pip install https://paddle-model-ecology.bj.bcebos.com/paddlex/PaddleX3.0/deploy/infer_om/ultar_infer_whl/ultra_infer_python-1.0.0-cp310-cp310-linux_x86_64.whl
-# aarch64 架构
-pip install https://paddle-model-ecology.bj.bcebos.com/paddlex/PaddleX3.0/deploy/infer_om/ultar_infer_whl/ultra_infer_python-1.0.0-cp310-cp310-linux_aarch64.whl
+pip install regex
+# 使用PaddleX命令安装高性能推理插件
+paddlex --install hpi-npu
 ```
 
 * 手动编译安装
@@ -67,10 +66,7 @@ cd PaddleX/libs/ultra-infer/python
 unset http_proxy https_proxy
 # 使能om,onnx后端,禁用paddle后端,禁用gpu
 export ENABLE_OM_BACKEND=ON ENABLE_ORT_BACKEND=ON ENABLE_PADDLE_BACKEND=OFF WITH_GPU=OFF
-# 第一次编译需要设置
-export ENABLE_VISION=ON
-export ENABLE_TEXT=ON
-# 注意,仅aarch机器需要设置NPU_HOST_LIB,指定libascend库
+# 注意,仅aarch64机器需要设置NPU_HOST_LIB,指定libascend库
 export NPU_HOST_LIB=/usr/local/Ascend/ascend-toolkit/latest/aarch64-linux/lib64
 python setup.py build
 python setup.py bdist_wheel
@@ -99,6 +95,13 @@ OM 后端支持模型列表如下,不同芯片之间 OM 模型不通用(更
 | 时序异常检测 | DLinear_ad | observed_cov_numeric:1,96,2 | 待提供 |
 | 图像特征 | PP-ShiTuV2_rec | x:1,3,224,224 | 待提供 |
 | 印章文本检测 | PP-OCRv4_server_seal_det | x:1,3,640,480 | 待提供 |
+| 印章文本检测 | PP-OCRv4_mobile_seal_det | x:1,3,640,480 | 待提供 |
+| 文档图像方向分类 | PP-LCNet_x1_0_doc_ori | x:1,3,224,224 | 待提供 |
+| 文档矫正 | UVDoc | x:1,3,736,736 | 待提供 |
+| 版面区域检测 | PP-DocLayout-L | im_shape:1,2;image:1,3,640,640;scale_factor:1,2 | 待提供 |
+| 表格分类 | PP-LCNet_x1_0_table_cls | x:1,3,224,224 | 待提供 |
+| 表格单元格检测 | RT-DETR-L_wired_table_cell_det | im_shape:1,2;image:1,3,640,640;scale_factor:1,2 | 待提供 |
+| 表格单元格检测 | RT-DETR-L_wireless_table_cell_det | im_shape:1,2;image:1,3,640,640;scale_factor:1,2 | 待提供 |
 
 ### 3.1 OM后端推理
 
@@ -108,15 +111,15 @@ OM 后端支持模型列表如下,不同芯片之间 OM 模型不通用(更
 
 如果您想使用自己的模型进行推理部署,先用 paddle2onnx 插件将导出的静态图模型转换为 ONNX 模型,再使用 ATC 工具转换为 OM 模型。inference.yml 在 PaddleX 导出模型时会自动生成,或者下载使用官方模型中的配置文件。
 
-值得注意的是,目前只支持使用 OM 静态 shape 进行推理,在转换时需要指定 input_shape,各模型输入shape参考上表,如果指定 shape 推理精度异常,可以参考 PaddleX 导出模型生成的 inference.yml 配置文件,修改 input_shape 参数。动态 shape 会在下个版本支持。
+由于310系列机器不支持动态 shape,目前只能使用固定 shape 进行推理,在转换 OM 时需要指定 input_shape,各模型输入shape参考上表,如果指定 shape 推理精度异常,可以参考 PaddleX 导出模型生成的 inference.yml 配置文件,修改 input_shape 参数。
 
-以 PP-OCRv4_mobile_rec 为例说明转化方法:
+以 PP-OCRv4_mobile_rec 为例说明 OM 转化方法:
 
  ```bash
 # 先使用PaddleX提供的paddle2onnx插件将训练导出的静态图转成onnx模型
 paddlex --paddle2onnx --paddle_model_dir <PaddlePaddle模型存储目录> --onnx_model_dir <ONNX模型存储目录>
 
-# 昇腾默认支持fp16,即算子支持float16和float32数据类型时,强制选择float16
+# 昇腾默认支持fp16精度
 # 使用静态shape,通过参数input_shape指定输入shape
 atc --model=inference.onnx --framework=5 --output=inference --soc_version=Ascend910B2 --input_shape "x:1,3,48,320"
 # 如果需要fp32精度,需要在转换命令中加上--precision_mode_v2=origin
@@ -131,10 +134,9 @@ atc --model=inference.onnx --framework=5 --output=inference --soc_version=Ascend
 
 PP-OCRv4_mobile_rec:
 
-```python
-# 下载推理示例图片
-# wget https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_ocr_rec_001.png
+下载官方提供的[OCR示例图片](https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_ocr_rec_001.png),运行下面 python 代码即可完成推理。
 
+```python
 from paddlex import create_model
 
 hpi_config = {
@@ -156,15 +158,14 @@ for res in output:
 
 ResNet50:
 
-```python
-# 下载推理示例图片
-# wget https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_image_classification_001.jpg
+下载官方提供的[图像分类示例图片](https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_image_classification_001.jpg),运行下面 python 代码即可完成推理。
 
+```python
 from paddlex import create_model
 
 hpi_config = {
     "auto_config": False,   # 关闭自动配置功能,手动配置后端
-    "backend": "om", # 选用om后端,昇腾上可选值为:"onnxruntime"、"om"
+    "backend": "om", # 选用om后端
 }
 
 # 无需传参input_shape
@@ -176,13 +177,14 @@ for res in output:
     res.save_to_json("./output/res.json")
 ```
 
-如遇到推理问题,可以先参考本文档第5小节:常见问题解决方法,如果仍未解决,可以给 PaddleX 官方提 issue,或者加入 PaddleX 官方交流群进行讨论。
+如遇到问题,可以先参考本文档第5小节:常见问题解决方法,如果仍未解决,可以给 PaddleX 官方提 issue,或者加入 PaddleX 官方交流群进行讨论。
 
 ### 3.2 ORT后端推理
 
-ORT 后端推理使用方法与 OM 后端类似,OM 不支持的模型,可以使用 ORT 后端进行推理。
+ORT 即 ONNXRUNTIME, 推理使用方法与 OM 后端类似,OM 不支持的模型,可以使用 ORT 后端进行推理。
 
 * 准备 ONNX 模型及配置文件
+
 各模型的静态图权重可通过[PaddleX模型列表(昇腾 NPU)](../support_list/model_list_npu.md)进行下载,如果使用您自己训练的模型,可以使用 PaddleX 提供的 paddle2onnx 插件将静态图模型转换为 ONNX 模型,放置在指定目录下。
 
 ```bash
@@ -196,9 +198,6 @@ ORT 后端支持动态 shape,不需要考虑 input_shape 的问题;此外,
 以 PP-OCRv4_mobile_rec 为例:
 
 ```python
-# 下载推理示例图片
-# wget https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_ocr_rec_001.png
-
 from paddlex import create_model
 
 hpi_config = {
@@ -285,10 +284,9 @@ SubModules:
 
 * 使用 PaddleX Python API 进行推理
 
-```python
-# 下载推理示例图片
-# wget https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_ocr_002.png
+下载官方提供的[示例图片](https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_ocr_002.png),运行下面 python 代码即可完成产线推理。
 
+```python
 from paddlex import create_pipeline
 # pipeline设置为修改后的产线配置文件,use_hpip表示使用高性能推理
 pipeline = create_pipeline(pipeline="./my_path/OCR.yaml", device="npu", use_hpip=True)
@@ -403,3 +401,5 @@ export LD_PRELOAD=/usr/lib/aarch64-linux-gnu/libgomp.so.1:$LD_PRELOAD
 export LD_PRELOAD=/usr/lib/aarch64-linux-gnu/libGLdispatch.so.0:$LD_PRELOAD
 export LD_PRELOAD=/usr/local/lib/python3.10/dist-packages/scikit_learn.libs/libgomp-d22c30c5.so.1.0.0:$LD_PRELOAD
 ```
+
+更多关于高性能推理的使用教程,可以参考[PaddleX 高性能推理指南](../pipeline_deploy/high_performance_inference.md)