config.yaml 5.7 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142
  1. # OCR验证工具配置文件
  2. # 样式配置
  3. styles:
  4. font_size: 8
  5. colors:
  6. primary: "#0288d1"
  7. secondary: "#ff9800"
  8. success: "#4caf50"
  9. error: "#f44336"
  10. warning: "#ff9800"
  11. background: "#fafafa"
  12. text: "#333333"
  13. layout:
  14. default_zoom: 1.0
  15. default_height: 800
  16. sidebar_width: 1
  17. content_width: 0.65
  18. # 界面配置
  19. ui:
  20. page_title: "OCR可视化校验工具"
  21. page_icon: "🔍"
  22. layout: "wide"
  23. sidebar_state: "expanded"
  24. # OCR数据配置
  25. ocr:
  26. min_text_length: 2
  27. default_confidence: 1.0
  28. exclude_texts: ["Picture", ""]
  29. # 图片方向检测配置
  30. orientation_detection:
  31. enabled: true
  32. confidence_threshold: 0.3 # 置信度阈值
  33. methods: ["opencv_analysis"] # 检测方法
  34. cache_results: true # 缓存检测结果
  35. # OCR工具类型配置
  36. tools:
  37. dots_ocr:
  38. name: "Dots OCR"
  39. description: "专业VLM OCR"
  40. json_structure: "array" # JSON为数组格式
  41. text_field: "text"
  42. bbox_field: "bbox"
  43. category_field: "category"
  44. confidence_field: "confidence"
  45. # 旋转处理配置
  46. rotation:
  47. coordinates_are_pre_rotated: false # 坐标不是预旋转的
  48. ppstructv3:
  49. name: "PPStructV3"
  50. description: "PaddleOCR PP-StructureV3"
  51. json_structure: "object" # JSON为对象格式
  52. parsing_results_field: "parsing_res_list"
  53. text_field: "block_content"
  54. bbox_field: "block_bbox"
  55. category_field: "block_label"
  56. confidence_field: "confidence"
  57. # 旋转处理配置
  58. rotation:
  59. coordinates_are_pre_rotated: true # 坐标已经是预旋转的
  60. # 自动检测工具类型的规则
  61. auto_detection:
  62. enabled: true
  63. rules:
  64. - field_exists: "parsing_res_list" # 如果存在该字段,判断为ppstructv3
  65. tool_type: "ppstructv3"
  66. - json_is_array: true # 如果JSON是数组,判断为dots_ocr
  67. tool_type: "dots_ocr"
  68. data_sources:
  69. - name: "A用户_单元格扫描流水"
  70. ocr_tool: "dots_ocr"
  71. ocr_out_dir: "/Users/zhch158/workspace/data/流水分析/A用户_单元格扫描流水/data_DotsOCR_Results"
  72. src_img_dir: "/Users/zhch158/workspace/data/流水分析/A用户_单元格扫描流水/data_DotsOCR_Results/A用户_单元格扫描流水"
  73. description: "A用户使用Dots OCR的单元格扫描结果"
  74. - name: "A用户_单元格扫描流水"
  75. ocr_tool: "ppstructv3"
  76. ocr_out_dir: "/Users/zhch158/workspace/data/流水分析/A用户_单元格扫描流水/data_PPStructureV3_Results"
  77. src_img_dir: "/Users/zhch158/workspace/data/流水分析/A用户_单元格扫描流水/data_PPStructureV3_Results/A用户_单元格扫描流水"
  78. description: "A用户使用PPStructV3的单元格扫描结果"
  79. - name: "A用户_单元格图片合成"
  80. ocr_tool: "dots_ocr"
  81. ocr_out_dir: "/Users/zhch158/workspace/data/流水分析/A用户_单元格图片合成/data_DotsOCR_Results"
  82. src_img_dir: "/Users/zhch158/workspace/data/流水分析/A用户_单元格图片合成/data_DotsOCR_Results/A用户_单元格图片合成"
  83. description: "A用户使用Dots OCR的单元格图片合成结果"
  84. - name: "A用户_单元格图片合成"
  85. ocr_tool: "ppstructv3"
  86. ocr_out_dir: "/Users/zhch158/workspace/data/流水分析/A用户_单元格图片合成/data_PPStructureV3_Results"
  87. src_img_dir: "/Users/zhch158/workspace/data/流水分析/A用户_单元格图片合成/data_PPStructureV3_Results/A用户_单元格图片合成"
  88. description: "A用户使用PPStructV3的单元格图片合成结果"
  89. - name: "B用户_扫描流水"
  90. ocr_tool: "dots_ocr"
  91. ocr_out_dir: "/Users/zhch158/workspace/data/流水分析/B用户_扫描流水/data_DotsOCR_Results"
  92. src_img_dir: "/Users/zhch158/workspace/data/流水分析/B用户_扫描流水/data_DotsOCR_Results/B用户_扫描流水"
  93. description: "B用户使用Dots OCR的扫描结果"
  94. - name: "B用户_扫描流水"
  95. ocr_tool: "ppstructv3"
  96. ocr_out_dir: "/Users/zhch158/workspace/data/流水分析/B用户_扫描流水/data_PPStructureV3_Results"
  97. src_img_dir: "/Users/zhch158/workspace/data/流水分析/B用户_扫描流水/data_PPStructureV3_Results/B用户_扫描流水"
  98. description: "B用户使用PPStructV3的扫描结果"
  99. - name: "B用户_图片合成流水"
  100. ocr_tool: "dots_ocr"
  101. ocr_out_dir: "/Users/zhch158/workspace/data/流水分析/B用户_图片合成流水/data_DotsOCR_Results"
  102. src_img_dir: "/Users/zhch158/workspace/data/流水分析/B用户_图片合成流水/data_DotsOCR_Results/B用户_图片合成流水"
  103. description: "B用户使用Dots OCR的图片合成结果"
  104. - name: "B用户_图片合成流水"
  105. ocr_tool: "ppstructv3"
  106. ocr_out_dir: "/Users/zhch158/workspace/data/流水分析/B用户_图片合成流水/data_PPStructureV3_Results"
  107. src_img_dir: "/Users/zhch158/workspace/data/流水分析/B用户_图片合成流水/data_PPStructureV3_Results/B用户_图片合成流水"
  108. description: "B用户使用PPStructV3的图片合成结果"
  109. - name: "至远彩色_2023年报"
  110. ocr_tool: "dots_ocr"
  111. ocr_out_dir: "/Users/zhch158/workspace/data/至远彩色印刷工业有限公司/data_DotsOCR_Results"
  112. src_img_dir: "/Users/zhch158/workspace/data/至远彩色印刷工业有限公司/data_DotsOCR_Results/2023年度报告母公司"
  113. description: "至远彩色使用Dots OCR的2023年报"
  114. - name: "至远彩色_2023年报"
  115. ocr_tool: "ppstructv3"
  116. ocr_out_dir: "/Users/zhch158/workspace/data/至远彩色印刷工业有限公司/data_PPStructureV3_Results"
  117. src_img_dir: "/Users/zhch158/workspace/data/至远彩色印刷工业有限公司/data_PPStructureV3_Results/2023年度报告母公司"
  118. description: "至远彩色使用PPStructV3的2023年报"
  119. # 预校验结果文件路径
  120. pre_validation:
  121. out_dir: "./output/pre_validation/"