zhch158_admin c11f2ea045 feat: 添加 detect_page_type 方法以检测 PDF 页面类型(文本或扫描OCR) преди 3 дни
..
__init__.py a7520b9498 feat: 添加多个工具模块,包括设备检测、图像处理、HTML/Markdown 处理和数字解析功能 преди 2 седмици
bbox_utils.py d9cd45f487 feat: Add BBoxExtractor for bounding box extraction and coordinate transformation преди 2 седмици
compare_pdf_renderers.py 4e6c855b17 feat: 添加PDF渲染引擎对比分析工具,支持分析图像属性和差异 преди 1 седмица
device_utils.py a7520b9498 feat: 添加多个工具模块,包括设备检测、图像处理、HTML/Markdown 处理和数字解析功能 преди 2 седмици
file_utils.py 499120d8c4 refactor: Implement lazy loading for PDFUtils and extract_pdf_pages преди 3 седмици
html_generator.py d810bf44fc feat: Add output formatter v2 and PDF extraction utilities преди 3 седмици
html_utils.py a7520b9498 feat: 添加多个工具模块,包括设备检测、图像处理、HTML/Markdown 处理和数字解析功能 преди 2 седмици
image_utils.py a7520b9498 feat: 添加多个工具模块,包括设备检测、图像处理、HTML/Markdown 处理和数字解析功能 преди 2 седмици
json_formatters.py 1c0b393dd3 feat: 添加页面旋转角度支持到 mineru_vllm_results_cell_bbox 格式转换 преди 2 седмици
log_utils.py d810bf44fc feat: Add output formatter v2 and PDF extraction utilities преди 3 седмици
markdown_generator.py a7520b9498 feat: 添加多个工具模块,包括设备检测、图像处理、HTML/Markdown 处理和数字解析功能 преди 2 седмици
normalize_financial_numbers.py d810bf44fc feat: Add output formatter v2 and PDF extraction utilities преди 3 седмици
number_utils.py a7520b9498 feat: 添加多个工具模块,包括设备检测、图像处理、HTML/Markdown 处理和数字解析功能 преди 2 седмици
output_formatter_v2.py d810bf44fc feat: Add output formatter v2 and PDF extraction utilities преди 3 седмици
pdf_README.md 58d9568b0f feat: add PDF text extraction module and refactor PDF utilities преди 4 дни
pdf_coordinate_transform.py 58d9568b0f feat: add PDF text extraction module and refactor PDF utilities преди 4 дни
pdf_extractor.py 499120d8c4 refactor: Implement lazy loading for PDFUtils and extract_pdf_pages преди 3 седмици
pdf_image_rendering.py 58d9568b0f feat: add PDF text extraction module and refactor PDF utilities преди 4 дни
pdf_text_extraction.py f2079d9e4f feat: 添加 detect_page_type 函数以检测 PDF 页面的类型(文字页或图片页) преди 3 дни
pdf_utils.py c11f2ea045 feat: 添加 detect_page_type 方法以检测 PDF 页面类型(文本或扫描OCR) преди 3 дни
visualization_utils.py a7520b9498 feat: 添加多个工具模块,包括设备检测、图像处理、HTML/Markdown 处理和数字解析功能 преди 2 седмици