Explorar o código

feat(cell_fusion): 添加多源单元格融合配置,支持 RT-DETR 和 UNet 权重调整

zhch158_admin hai 2 semanas
pai
achega
04dc63a20f

+ 21 - 0
ocr_tools/universal_doc_parser/config/bank_statement_yusys_v3.yaml

@@ -75,6 +75,27 @@ table_recognition_wired:
   # 是否启用倾斜矫正
   enable_deskew: true
 
+  # 🆕 启用多源单元格融合
+  use_cell_fusion: true
+  
+  # 融合引擎配置
+  cell_fusion:
+    # RT-DETR 模型路径(必需)
+    rtdetr_model_path: "/Users/zhch158/workspace/repository.git/ocr_platform/ocr_tools/pytorch_models/Table/RT-DETR-L_wired_table_cell_det.onnx"
+    
+    # 融合权重
+    unet_weight: 0.6        # UNet 权重(结构性强)
+    rtdetr_weight: 0.4      # RT-DETR 权重(鲁棒性强)
+    
+    # 阈值配置
+    iou_merge_threshold: 0.7    # 高IoU合并阈值(>0.7则加权平均)
+    iou_nms_threshold: 0.5      # NMS去重阈值
+    rtdetr_conf_threshold: 0.5  # RT-DETR置信度阈值
+    
+    # 功能开关
+    enable_ocr_compensation: true      # 启用OCR孤立文本补偿
+    skip_rtdetr_for_txt_pdf: true      # 🎯 文字PDF跳过RT-DETR(自适应策略)
+
   # Debug 可视化配置(与 MinerUWiredTableRecognizer.DebugOptions 对齐)
   # 默认关闭。开启后将保存:表格线、连通域、逻辑网格结构、文本覆盖可视化。
   debug_options: