6 месяцев назад · 05d07bb9ef
--- a/ocr_tools/universal_doc_parser/core/pipeline_manager_v2.py
+++ b/ocr_tools/universal_doc_parser/core/pipeline_manager_v2.py
@@ -57,6 +57,7 @@ except ImportError:
 
															     TableCellMatcher = None
														
 
															     TextMatcher = None
														
 
															+from ocr_utils.bbox_utils import BBoxExtractor
														
 
															 class EnhancedDocPipeline:
														
 
															     """增强版文档处理流水线"""
														
@@ -350,6 +351,9 @@ class EnhancedDocPipeline:
 
															             logger.info(f"📝 Page {page_idx}: OCR detected {len(all_ocr_spans)} text spans")
														
 
															         except Exception as e:
														
 
															             logger.warning(f"⚠️ Full-page OCR failed: {e}")
														
 
															+
														
 
															+        skew_angle = BBoxExtractor.calculate_skew_angle(all_ocr_spans)
														
 
															+        logger.info(f"📊 Wired table skew angle: {skew_angle:.3f}°")
														
 
															         # 4. 将 OCR spans 匹配到 layout blocks
														
 
															         matched_spans = SpanMatcher.match_spans_to_blocks(