|
|
@@ -4,9 +4,10 @@ from pathlib import Path
|
|
|
|
|
|
# input_path = "./sample_data/300674-母公司现金流量表-扫描.png"
|
|
|
# input_path = "/home/ubuntu/zhch/data/至远彩色印刷工业有限公司/2023年度报告母公司.img/2023年度报告母公司_page_006.png"
|
|
|
-input_path = "/Users/zhch158/workspace/data/至远彩色印刷工业有限公司/PaddleOCR_VL_Results/2023年度报告母公司/2023年度报告母公司_page_003.png"
|
|
|
+# input_path = "/Users/zhch158/workspace/data/流水分析/B用户_扫描流水/PaddleOCR_VL_Results/B用户_扫描流水/B用户_扫描流水_page_002.png"
|
|
|
+input_path = "/Users/zhch158/workspace/data/至远彩色印刷工业有限公司/2023年度报告母公司.img/2023年度报告母公司_page_003_270.png"
|
|
|
|
|
|
-pipeline_path = "./my_config/PaddleOCR-VL-Client.yaml"
|
|
|
+pipeline_path = "./my_config/PaddleOCR-VL-Client_debug.yaml"
|
|
|
pipeline_name = Path(pipeline_path).stem
|
|
|
output_path = Path(f"./sample_data/single_pipeline_output/{pipeline_name}/")
|
|
|
|
|
|
@@ -18,6 +19,7 @@ output = pipeline.predict(
|
|
|
useLayoutDetection=False, # 开启版面分析
|
|
|
useDocOrientationClassify=False, # 开启文档方向分类
|
|
|
useDocUnwarping=False, # 开启文档去畸变
|
|
|
+ prompt_label="table", # 指定识别类别的提示词
|
|
|
)
|
|
|
|
|
|
# 可视化结果并保存 json 结果
|