Эх сурвалжийг харах

feat(更新VL识别配置): 将GLM-OCR模块更改为PaddleOCR,更新相关参数以支持更大的图片尺寸和并发处理

zhch158_admin 1 долоо хоног өмнө
parent
commit
de041fe413

+ 11 - 7
ocr_tools/universal_doc_parser/config/bank_statement_paddle_vl_local.yaml

@@ -157,13 +157,17 @@ table_recognition_wired:
 # VL识别配置 - 使用 GLM-OCR(无线表格 + seal识别)
 # ============================================================
 vl_recognition:
-  module: "glmocr"
-  api_url: "http://localhost:8102/v1/chat/completions"
-  api_key: null  # 可选,如需要可填写
-  model: "glm-ocr"
-  max_image_size: 3500  # GLM-OCR 推荐的最大图片尺寸
-  resize_mode: 'max'    # 缩放模式: 'max' 保持宽高比, 'fixed' 固定尺寸
-  verify_ssl: false
+  module: "paddle"
+  backend: "http-client"
+  model_name: "PaddleOCR-VL-1.5"  # 与 paddle_local_daemon.sh 中 MODEL_NAME 一致
+  server_url: "http://localhost:8102"
+  max_image_size: 4096  # 🔧 添加:最大图片尺寸
+  resize_mode: 'max'    # 🔧 添加:缩放模式 ('max' 保持宽高比, 'fixed' 固定尺寸)
+  device: "cpu"
+  batch_size: 1
+  model_params:
+    max_concurrency: 10
+    http_timeout: 600
   
   # Task prompt mapping - 针对不同任务使用不同提示词
   task_prompt_mapping: