소스 검색

feat: 新增关键代码段,包含类型定义和后处理工具的路径

zhch158_admin 2 주 전
부모
커밋
13c12e74f5
1개의 변경된 파일8개의 추가작업 그리고 0개의 파일을 삭제
  1. 8 0
      zhch/mineru_处理流程.md

+ 8 - 0
zhch/mineru_处理流程.md

@@ -698,3 +698,11 @@ final_blocks = post_process(blocks)
 4. **质量保证**:全局定位+局部细节,双重保障
 
 这种设计使得单个VLM模型能够达到甚至超越多模型Pipeline的效果。
+
+# 关键代码
+```bash
+mineru/utils/enum_class.py #类型
+mineru/utils/format_utils.py #vlm表格后处理otsl
+mineru/utils/pdf_text_tool.py #文字pdf解析
+mineru/utils/table_merge.py #后处理表格合并
+```