zhch158_admin
|
fadba9a24b
fix(修复MinerU组件导入路径): 修改MinerU组件的导入路径以确保正确加载
|
1 tydzień temu |
zhch158_admin
|
b6b75a00ba
feat(新增PDF字节数据支持): 在PDFUtils中添加可选的pdf_bytes参数,支持内存中预处理后的PDF加载
|
1 tydzień temu |
zhch158_admin
|
f32729046f
feat: 统一坐标系输出逻辑,增加return_upright_coords参数支持,优化文本提取功能
|
2 miesięcy temu |
zhch158_admin
|
c11f2ea045
feat: 添加 detect_page_type 方法以检测 PDF 页面类型(文本或扫描OCR)
|
2 miesięcy temu |
zhch158_admin
|
58d9568b0f
feat: add PDF text extraction module and refactor PDF utilities
|
2 miesięcy temu |
zhch158_admin
|
db1a81a141
feat: 添加 PDF 文档类型检测功能,支持 pypdfium2 和 fitz 渲染引擎,优化文本提取过程
|
2 miesięcy temu |
zhch158_admin
|
3263321e84
feat: 添加统一的PDF图像加载函数,支持多种渲染引擎
|
3 miesięcy temu |
zhch158_admin
|
3a5b2ab300
chore: Add .gitignore and a script to verify GridRecovery module import and cell computation with mocked dependencies.
|
3 miesięcy temu |
zhch158_admin
|
499120d8c4
refactor: Implement lazy loading for PDFUtils and extract_pdf_pages
|
3 miesięcy temu |
zhch158_admin
|
d810bf44fc
feat: Add output formatter v2 and PDF extraction utilities
|
3 miesięcy temu |