Переглянути джерело

feat(更新OCR文档配置): 修改OCR文档配置,更新输入文件、输出目录和配置文件路径,调整处理页面数量以支持新的文档格式。

zhch158_admin 2 днів тому
батько
коміт
35ee4abec4
1 змінених файлів з 5 додано та 5 видалено
  1. 5 5
      ocr_tools/universal_doc_parser/main_v2.py

+ 5 - 5
ocr_tools/universal_doc_parser/main_v2.py

@@ -644,10 +644,10 @@ if __name__ == "__main__":
             # "config": "./config/bank_statement_paddle_vl_local.yaml",
             # "log_file": "./output/logs/bank_statement_paddle_vl_local/process.log",
 
-            "input": "/Users/zhch158/workspace/data/流水分析/严_农业银行.pdf",
-            "output_dir": "/Users/zhch158/workspace/data/流水分析/严_农业银行/bank_statement_mineru_vl",
-            "config": "./config/bank_statement_mineru_vl_local.yaml",
-            "log_file": "./output/logs/bank_statement_mineru_vl/process.log",
+            "input": "/Users/zhch158/workspace/data/流水分析/陈3_微信图.pdf",
+            "output_dir": "/Users/zhch158/workspace/data/流水分析/陈3_微信图/bank_statement_yusys_local",
+            "config": "./config/bank_statement_yusys_local.yaml",
+            "log_file": "./output/logs/bank_statement_yusys_local/process.log",
 
             # 配置文件
             # "config": "./config/bank_statement_yusys_v4.yaml",
@@ -662,7 +662,7 @@ if __name__ == "__main__":
             # "scene": "financial_report",
             
             # 页面范围(可选)
-            "pages": "1",  # 只处理前1页
+            "pages": "3",  # 只处理前1页
             # "pages": "1-3,5,7-10",  # 处理指定页面
             # "pages": "83-109",  # 处理指定页面