Parcourir la source

feat: 新增关键代码段,包含类型定义和后处理工具的路径

zhch158_admin il y a 2 semaines
Parent
commit
13c12e74f5
1 fichiers modifiés avec 8 ajouts et 0 suppressions
  1. 8 0
      zhch/mineru_处理流程.md

+ 8 - 0
zhch/mineru_处理流程.md

@@ -698,3 +698,11 @@ final_blocks = post_process(blocks)
 4. **质量保证**:全局定位+局部细节,双重保障
 
 这种设计使得单个VLM模型能够达到甚至超越多模型Pipeline的效果。
+
+# 关键代码
+```bash
+mineru/utils/enum_class.py #类型
+mineru/utils/format_utils.py #vlm表格后处理otsl
+mineru/utils/pdf_text_tool.py #文字pdf解析
+mineru/utils/table_merge.py #后处理表格合并
+```