Kaynağa Gözat

feat(新增文档配置): 添加三个新的OCR文档配置文件,分别为陈3_微信图、彭_广东兴宁农村商业银行和钟_广东陆丰农村商业银行,定义了使用的OCR工具及其结果目录。

zhch158_admin 2 gün önce
ebeveyn
işleme
3e4d9ab6f0

+ 21 - 18
ocr_validator/config/global.yaml

@@ -145,21 +145,24 @@ pre_validation:
   out_dir: "./output/pre_validation/"
 
 data_sources:
-  - 德_内蒙古银行照.yaml
-  - 对公_招商银行图.yaml
-  - A用户_单元格扫描流水.yaml
-  - B用户_扫描流水.yaml
-  - 康强_北京农村商业银行.yaml
-  - 施博深.yaml
-  - 山西云集科技有限公司.yaml
-  - 至远彩色_2023年报.yaml
-  - 提取自赤峰黄金2023年报.yaml
-  - 乔_建设银行图.yaml
-  - 湛_平安银行图.yaml
-  - 朱_中信银行图.yaml
-  - 张_微信图.yaml
-  - 付_工商银行943825图.yaml
-  - 许_民生银行图.yaml
-  - 韩_中国银行图.yaml
-  - 杨万益_福建农信.yaml
-  - 严_农业银行.yaml
+  # - 德_内蒙古银行照.yaml
+  # - 对公_招商银行图.yaml
+  # - A用户_单元格扫描流水.yaml
+  # - B用户_扫描流水.yaml
+  # - 康强_北京农村商业银行.yaml
+  # - 施博深.yaml
+  # - 山西云集科技有限公司.yaml
+  # - 至远彩色_2023年报.yaml
+  # - 提取自赤峰黄金2023年报.yaml
+  # - 乔_建设银行图.yaml
+  # - 湛_平安银行图.yaml
+  # - 朱_中信银行图.yaml
+  # - 张_微信图.yaml
+  # - 付_工商银行943825图.yaml
+  # - 许_民生银行图.yaml
+  # - 韩_中国银行图.yaml
+  # - 杨万益_福建农信.yaml
+  # - 严_农业银行.yaml
+  - 陈3_微信图.yaml
+  - 彭_广东兴宁农村商业银行.yaml
+  - 钟_广东陆丰农村商业银行.yaml

+ 20 - 0
ocr_validator/config/彭_广东兴宁农村商业银行.yaml

@@ -0,0 +1,20 @@
+# 文档: 彭_广东兴宁农村商业银行
+document:
+  name: "彭_广东兴宁农村商业银行"
+  base_dir: "/Users/zhch158/workspace/data/流水分析/彭_广东兴宁农村商业银行"
+  
+  # 🎯 关键改进:定义该文档使用的 OCR 工具及其结果目录
+  ocr_results:
+    # bank_statement_yusys_local
+    - tool: "mineru"
+      result_dir: "bank_statement_yusys_local"
+      image_dir: "bank_statement_yusys_local/{{name}}"
+      description: "YUSYS-OCR框架(local) Wired UNET OCR GLM-OCR"
+      enabled: true
+
+    # bank_statement_glmocr_local
+    - tool: "mineru"
+      result_dir: "bank_statement_yusys_glmocr_local"
+      image_dir: "bank_statement_yusys_glmocr_local/{{name}}"
+      description: "YUSYS-OCR框架(local) GLM-OCR VLM"
+      enabled: true

+ 20 - 0
ocr_validator/config/钟_广东陆丰农村商业银行.yaml

@@ -0,0 +1,20 @@
+# 文档: 钟_广东陆丰农村商业银行
+document:
+  name: "钟_广东陆丰农村商业银行"
+  base_dir: "/Users/zhch158/workspace/data/流水分析/钟_广东陆丰农村商业银行"
+  
+  # 🎯 关键改进:定义该文档使用的 OCR 工具及其结果目录
+  ocr_results:
+    # bank_statement_yusys_local
+    - tool: "mineru"
+      result_dir: "bank_statement_yusys_local"
+      image_dir: "bank_statement_yusys_local/{{name}}"
+      description: "YUSYS-OCR框架(local) Wired UNET OCR GLM-OCR"
+      enabled: true
+
+    # bank_statement_glmocr_local
+    - tool: "mineru"
+      result_dir: "bank_statement_yusys_glmocr_local"
+      image_dir: "bank_statement_yusys_glmocr_local/{{name}}"
+      description: "YUSYS-OCR框架(local) GLM-OCR VLM"
+      enabled: true

+ 20 - 0
ocr_validator/config/陈3_微信图.yaml

@@ -0,0 +1,20 @@
+# 文档: 陈3_微信图
+document:
+  name: "陈3_微信图"
+  base_dir: "/Users/zhch158/workspace/data/流水分析/陈3_微信图"
+  
+  # 🎯 关键改进:定义该文档使用的 OCR 工具及其结果目录
+  ocr_results:
+    # bank_statement_yusys_local
+    - tool: "mineru"
+      result_dir: "bank_statement_yusys_local"
+      image_dir: "bank_statement_yusys_local/{{name}}"
+      description: "YUSYS-OCR框架(local) Wired UNET OCR GLM-OCR"
+      enabled: true
+
+    # bank_statement_glmocr_local
+    - tool: "mineru"
+      result_dir: "bank_statement_yusys_glmocr_local"
+      image_dir: "bank_statement_yusys_glmocr_local/{{name}}"
+      description: "YUSYS-OCR框架(local) GLM-OCR VLM"
+      enabled: true