Переглянути джерело

feat: Implement `mineru_wired_table_v2` adapter with enhanced table OCR preprocessing, grid recovery, and visualization utilities.

zhch158_admin 3 днів тому
батько
коміт
ce29ee3458

+ 5 - 3
ocr_tools/universal_doc_parser/config/bank_statement_wired_unet.yaml

@@ -38,12 +38,16 @@ table_recognition_wired:
   col_threshold: 15
   ocr_conf_threshold: 0.5
   cell_crop_margin: 2
+  use_custom_postprocess: true  # 是否使用自定义后处理(默认启用)
+
+  # 是否启用倾斜矫正
+  enable_deskew: true
 
   # Debug 可视化配置(与 MinerUWiredTableRecognizer.DebugOptions 对齐)
   # 默认关闭。开启后将保存:表格线、连通域、逻辑网格结构、文本覆盖可视化。
   debug_options:
     enabled: true               # 是否开启调试可视化输出
-    output_dir: "/Users/zhch158/workspace/repository.git/ocr_platform/ocr_tools/universal_doc_parser/output"             # 调试输出目录;null不输出
+    output_dir: null             # 调试输出目录;null不输出
     save_table_lines: true       # 保存表格线可视化(unet横线/竖线叠加)
     save_connected_components: true  # 保存连通域提取的单元格图
     save_grid_structure: true    # 保存逻辑网格结构(row/col/rowspan/colspan)
@@ -65,5 +69,3 @@ output:
   save_enhanced_json: true
   coordinate_precision: 2
   normalize_numbers: true
-
-use_custom_postprocess: true  # 是否使用自定义后处理(默认启用)