test_ppstructure_v3.py 1.2 KB

123456789101112131415161718192021222324252627282930
  1. from paddlex import create_pipeline
  2. import time
  3. from pathlib import Path
  4. input_path = "./sample_data/300674-母公司现金流量表-扫描.png"
  5. pipeline_path = "./PP-StructureV3-zhch.yaml"
  6. pipeline_name = Path(pipeline_path).stem
  7. output_path = Path(f"./sample_data/single_pipeline_output/{pipeline_name}/")
  8. pipeline = create_pipeline(pipeline=pipeline_path)
  9. # For Image
  10. output = pipeline.predict(
  11. input=input_path,
  12. device="gpu", # 或者 "gpu" 如果你有 GPU 支持
  13. use_doc_orientation_classify=True, # 开启文档方向分类
  14. use_doc_unwarping=False, # 开启文档去畸变, 效果不佳
  15. layout_detection_model_name=None, # 如果要禁用版面分析,可以这样设置,或者依赖其默认行为
  16. use_seal_recognition=True, # 跳过印章识别
  17. use_chart_recognition=True, # 跳过图表识别
  18. use_table_recognition=True, # 开启表格识别
  19. )
  20. # 可视化结果并保存 json 结果
  21. for res in output:
  22. res.print()
  23. # res.save_to_json(save_path="sample_data/output")
  24. # res.save_to_markdown(save_path="sample_data/output")
  25. res.save_all(save_path=output_path.as_posix()) # 保存所有结果到指定路径