zhch158_admin db1a81a141 feat: 添加 PDF 文档类型检测功能,支持 pypdfium2 和 fitz 渲染引擎,优化文本提取过程 il y a 3 jours
..
__init__.py a7520b9498 feat: 添加多个工具模块,包括设备检测、图像处理、HTML/Markdown 处理和数字解析功能 il y a 2 semaines
bbox_utils.py d9cd45f487 feat: Add BBoxExtractor for bounding box extraction and coordinate transformation il y a 2 semaines
compare_pdf_renderers.py 4e6c855b17 feat: 添加PDF渲染引擎对比分析工具,支持分析图像属性和差异 il y a 1 semaine
device_utils.py a7520b9498 feat: 添加多个工具模块,包括设备检测、图像处理、HTML/Markdown 处理和数字解析功能 il y a 2 semaines
file_utils.py 499120d8c4 refactor: Implement lazy loading for PDFUtils and extract_pdf_pages il y a 2 semaines
html_generator.py d810bf44fc feat: Add output formatter v2 and PDF extraction utilities il y a 3 semaines
html_utils.py a7520b9498 feat: 添加多个工具模块,包括设备检测、图像处理、HTML/Markdown 处理和数字解析功能 il y a 2 semaines
image_utils.py a7520b9498 feat: 添加多个工具模块,包括设备检测、图像处理、HTML/Markdown 处理和数字解析功能 il y a 2 semaines
json_formatters.py 1c0b393dd3 feat: 添加页面旋转角度支持到 mineru_vllm_results_cell_bbox 格式转换 il y a 2 semaines
log_utils.py d810bf44fc feat: Add output formatter v2 and PDF extraction utilities il y a 3 semaines
markdown_generator.py a7520b9498 feat: 添加多个工具模块,包括设备检测、图像处理、HTML/Markdown 处理和数字解析功能 il y a 2 semaines
normalize_financial_numbers.py d810bf44fc feat: Add output formatter v2 and PDF extraction utilities il y a 3 semaines
number_utils.py a7520b9498 feat: 添加多个工具模块,包括设备检测、图像处理、HTML/Markdown 处理和数字解析功能 il y a 2 semaines
output_formatter_v2.py d810bf44fc feat: Add output formatter v2 and PDF extraction utilities il y a 3 semaines
pdf_extractor.py 499120d8c4 refactor: Implement lazy loading for PDFUtils and extract_pdf_pages il y a 2 semaines
pdf_utils.py db1a81a141 feat: 添加 PDF 文档类型检测功能,支持 pypdfium2 和 fitz 渲染引擎,优化文本提取过程 il y a 3 jours
visualization_utils.py a7520b9498 feat: 添加多个工具模块,包括设备检测、图像处理、HTML/Markdown 处理和数字解析功能 il y a 2 semaines