Quellcode durchsuchen

feat(新增印章OCR识别器创建方法): 在ModelFactory类中添加create_seal_ocr_recognizer方法,用于创建并初始化SealOCRRecognizer,提升印章OCR识别能力。

zhch158_admin vor 1 Monat
Ursprung
Commit
d1e3ac399d
1 geänderte Dateien mit 8 neuen und 0 gelöschten Zeilen
  1. 8 0
      ocr_tools/universal_doc_parser/core/model_factory.py

+ 8 - 0
ocr_tools/universal_doc_parser/core/model_factory.py

@@ -115,6 +115,14 @@ class ModelFactory:
             raise ValueError(f"Unknown table classifier module: {module_name}")
     
     @classmethod
+    def create_seal_ocr_recognizer(cls, config: Dict[str, Any]):
+        """创建印章 OCR 识别器(基于 MinerU PytorchPaddleOCR lang=seal)"""
+        from models.adapters import SealOCRRecognizer
+        recognizer = SealOCRRecognizer(config)
+        recognizer.initialize()
+        return recognizer
+    
+    @classmethod
     def cleanup_all(cls):
         """清理所有模型资源"""
         # 在实际应用中,可以维护一个活跃模型列表进行清理