Jelajahi Sumber

feat(更新PDF分类工具注释): 添加PDF分类工具的注释,说明优先使用MinerU原版及延迟导入策略

zhch158_admin 1 Minggu lalu
induk
melakukan
abedc4e5b6
1 mengubah file dengan 3 tambahan dan 0 penghapusan
  1. 3 0
      ocr_utils/__init__.py

+ 3 - 0
ocr_utils/__init__.py

@@ -56,6 +56,9 @@ from .number_utils import (
     parse_number,
     normalize_text_number
 )
+# PDF 分类工具(封装自 MinerU,优先使用 MinerU 原版,MinerU 不可用时退回内置实现)
+# PDFUtils 和 extract_pdf_pages 使用延迟导入,避免在 PaddleX 环境中触发 MinerU 导入检查
+# from .pdf_classify import classify as pdf_classify  # 按需 import,避免强依赖
 # 坐标工具使用延迟导入,避免循环依赖
 # from .coordinate_utils import CoordinateUtils  # 已移除,改为延迟导入