瀏覽代碼

feat(更新PDF分类工具注释): 添加PDF分类工具的注释,说明优先使用MinerU原版及延迟导入策略

zhch158_admin 1 周之前
父節點
當前提交
abedc4e5b6
共有 1 個文件被更改,包括 3 次插入0 次删除
  1. 3 0
      ocr_utils/__init__.py

+ 3 - 0
ocr_utils/__init__.py

@@ -56,6 +56,9 @@ from .number_utils import (
     parse_number,
     normalize_text_number
 )
+# PDF 分类工具(封装自 MinerU,优先使用 MinerU 原版,MinerU 不可用时退回内置实现)
+# PDFUtils 和 extract_pdf_pages 使用延迟导入,避免在 PaddleX 环境中触发 MinerU 导入检查
+# from .pdf_classify import classify as pdf_classify  # 按需 import,避免强依赖
 # 坐标工具使用延迟导入,避免循环依赖
 # from .coordinate_utils import CoordinateUtils  # 已移除,改为延迟导入