Эх сурвалжийг харах

feat: 添加调试可视化配置,支持表格线、连通域和逻辑网格结构的保存

zhch158_admin 6 өдөр өмнө
parent
commit
f1b3fdea5b

+ 12 - 0
ocr_tools/universal_doc_parser/config/bank_statement_wired_unet.yaml

@@ -39,6 +39,18 @@ table_recognition_wired:
   ocr_conf_threshold: 0.5
   cell_crop_margin: 2
 
+  # Debug 可视化配置(与 MinerUWiredTableRecognizer.DebugOptions 对齐)
+  # 默认关闭。开启后将保存:表格线、连通域、逻辑网格结构、文本覆盖可视化。
+  debug_options:
+    enabled: true               # 是否开启调试可视化输出
+    output_dir: "/Users/zhch158/workspace/repository.git/ocr_platform/ocr_tools/universal_doc_parser/output"             # 调试输出目录;null不输出
+    save_table_lines: true       # 保存表格线可视化(unet横线/竖线叠加)
+    save_connected_components: true  # 保存连通域提取的单元格图
+    save_grid_structure: true    # 保存逻辑网格结构(row/col/rowspan/colspan)
+    save_text_overlay: true      # 保存文本填充覆盖图
+    image_format: "png"          # 可视化图片格式:png/jpg
+    prefix: ""                  # 保存文件名前缀(如设置为页码/表格序号)
+
 output:
   create_subdir: false
   save_json: true