소스 검색

feat: 更新示例输入输出路径,添加新的测试案例

zhch158_admin 1 주 전
부모
커밋
f250ca80b9
1개의 변경된 파일7개의 추가작업 그리고 3개의 파일을 삭제
  1. 7 3
      ocr_tools/universal_doc_parser/main_v2.py

+ 7 - 3
ocr_tools/universal_doc_parser/main_v2.py

@@ -408,10 +408,14 @@ if __name__ == "__main__":
             # "input": "/Users/zhch158/workspace/data/流水分析/B用户_扫描流水.pdf",
             # "output_dir": "/Users/zhch158/workspace/data/流水分析/B用户_扫描流水/bank_statement_yusys_v2",
 
-            "input": "/Users/zhch158/workspace/data/流水分析/2023年度报告母公司.pdf",
-            "output_dir": "./output/2023年度报告母公司/bank_statement_wired_unet",
+            # "input": "/Users/zhch158/workspace/repository.git/ocr_platform/ocr_tools/universal_doc_parser/tests/2023年度报告母公司_page_006_270.png",
+            # "output_dir": "./output/2023年度报告母公司/bank_statement_wired_unet",
+            # "input": "/Users/zhch158/workspace/data/流水分析/2023年度报告母公司.pdf",
             # "output_dir": "/Users/zhch158/workspace/data/流水分析/2023年度报告母公司/bank_statement_yusys_v2",
 
+            "input": "/Users/zhch158/workspace/repository.git/ocr_platform/ocr_tools/universal_doc_parser/tests/600916_中国黄金_2022年报_page_096.png",
+            "output_dir": "./output/600916_中国黄金_2022年报/bank_statement_wired_unet",
+
             # "input": "/Users/zhch158/workspace/data/流水分析/施博深.pdf",
             # "output_dir": "/Users/zhch158/workspace/data/流水分析/施博深/bank_statement_yusys_v2",
 
@@ -430,7 +434,7 @@ if __name__ == "__main__":
             "scene": "bank_statement",
             
             # 页面范围(可选)
-            "pages": "6",  # 只处理前1页
+            # "pages": "6",  # 只处理前1页
             # "pages": "1-3,5,7-10",  # 处理指定页面
 
             "streaming": True,