před 4 měsíci · 87c5b916fb
--- a/ocr_tools/universal_doc_parser/core/layout_model_router.py
+++ b/ocr_tools/universal_doc_parser/core/layout_model_router.py
@@ -30,12 +30,15 @@ class SmartLayoutRouter(BaseLayoutDetector):
 
															     def __init__(self, config: Dict[str, Any]):
														
 
															         super().__init__(config)
														
 
															-        self.strategy = config.get('strategy', 'ocr_eval')  # ocr_eval, auto
														
 
															+        self.strategy = config.get('strategy', 'ocr_eval')  # ocr_eval, auto, scene
														
 
															         self.models = {}
														
 
															         self.model_configs = config.get('models', {})
														
 
															         self.fallback_config = config.get('fallback_model', None)
														
 
															         self.evaluator = OCRBasedLayoutEvaluator()
														
 
															         self.ocr_recognizer = None  # 用于在ocr_eval策略中获取OCR结果
														
 
															+        self.scene_name = config.get('scene_name', None)
														
 
															+        self.scene_strategy = config.get('scene_strategy', {})
														
 
															+        self.default_model = config.get('default_model', None)
														
 
															         # 调试模式支持
														
 
															         self.debug_mode = config.get('debug_mode', False)
														
 
															         self.output_dir = config.get('output_dir', None)
														
@@ -90,6 +93,10 @@ class SmartLayoutRouter(BaseLayoutDetector):
 
															     def set_ocr_recognizer(self, ocr_recognizer):
														
 
															         """设置OCR识别器（用于ocr_eval策略）"""
														
 
															         self.ocr_recognizer = ocr_recognizer
														
 
															+
														
 
															+    def set_scene_name(self, scene_name: Optional[str]):
														
 
															+        """设置场景名称（用于scene策略）"""
														
 
															+        self.scene_name = scene_name
														
 
															     def _detect_raw(
														
 
															         self, 
														
@@ -137,8 +144,40 @@ class SmartLayoutRouter(BaseLayoutDetector):
 
															             return self._ocr_eval_detect(image, ocr_spans)
														
 
															         elif self.strategy == 'auto':
														
 
															             return self._auto_select_detect(image)
														
 
															+        elif self.strategy == 'scene':
														
 
															+            return self._scene_select_detect(image)
														
 
															         else:
														
 
															             raise ValueError(f"Unknown strategy: {self.strategy}")
														
 
															+
														
 
															+    def _scene_select_detect(
														
 
															+        self,
														
 
															+        image: Union[np.ndarray, Image.Image]
														
 
															+    ) -> List[Dict[str, Any]]:
														
 
															+        """
														
 
															+        场景策略：根据scene_strategy直接选择模型
														
 
															+
														
 
															+        注意：不执行ocr_eval，直接使用选定模型
														
 
															+        """
														
 
															+        selected_model = None
														
 
															+        if self.scene_name:
														
 
															+            scene_rule = self.scene_strategy.get(self.scene_name)
														
 
															+            if isinstance(scene_rule, str):
														
 
															+                selected_model = scene_rule
														
 
															+            elif isinstance(scene_rule, dict):
														
 
															+                selected_model = scene_rule.get('model')
														
 
															+
														
 
															+        if not selected_model:
														
 
															+            selected_model = self.default_model
														
 
															+
														
 
															+        if not selected_model and self.models:
														
 
															+            selected_model = next(iter(self.models.keys()))
														
 
															+
														
 
															+        if selected_model not in self.models:
														
 
															+            logger.warning(f"⚠️ Scene strategy model not available: {selected_model}, using first model")
														
 
															+            selected_model = next(iter(self.models.keys()))
														
 
															+
														
 
															+        logger.info(f"🎯 Scene strategy selected model: {selected_model} (scene: {self.scene_name})")
														
 
															+        return self.models[selected_model].detect(image)
														
 
															     def _ocr_eval_detect(
														
 
															         self, 
														
--- a/ocr_tools/universal_doc_parser/core/pipeline_manager_v2.py
+++ b/ocr_tools/universal_doc_parser/core/pipeline_manager_v2.py
@@ -117,6 +117,15 @@ class EnhancedDocPipeline:
 
															         self._init_element_processors()
														
 
															         logger.info(f"✅ Pipeline initialized for scene: {self.scene_name}")
														
 
															+
														
 
															+    def set_scene_name(self, scene_name: Optional[str]):
														
 
															+        """设置场景名称，并同步到布局路由器"""
														
 
															+        if not scene_name:
														
 
															+            return
														
 
															+        self.scene_name = scene_name
														
 
															+        if hasattr(self.layout_detector, 'set_scene_name'):
														
 
															+            self.layout_detector.set_scene_name(scene_name)
														
 
															+        logger.info(f"🔄 Scene updated in pipeline: {scene_name}")
														
 
															     def _ensure_vl_recognizer(self):
														
 
															         """懒加载 VL 识别器（仅在需要时初始化，且只初始化一次）"""
														
@@ -155,6 +164,9 @@ class EnhancedDocPipeline:
 
															             self.layout_detector = ModelFactory.create_layout_detector(
														
 
															                 self.config['layout_detection']
														
 
															             )
														
 
															+
														
 
															+            if hasattr(self.layout_detector, 'set_scene_name'):
														
 
															+                self.layout_detector.set_scene_name(self.scene_name)
														
 
															             # 如果是智能路由器且使用ocr_eval策略，需要设置OCR识别器
														
 
															             if hasattr(self.layout_detector, 'set_ocr_recognizer'):