zhch158_admin 7fa6ad09bb feat(新增水印处理工具模块): 添加图像级和PDF层级水印检测与去除功能,支持多种输入格式 před 1 týdnem
..
__init__.py 71f6e7c39c feat(table-coordinates): add table coordinate utility module for OCR processing před 2 měsíci
bbox_utils.py d9cd45f487 feat: Add BBoxExtractor for bounding box extraction and coordinate transformation před 3 měsíci
compare_pdf_renderers.py 4e6c855b17 feat: 添加PDF渲染引擎对比分析工具,支持分析图像属性和差异 před 3 měsíci
coordinate_utils.py 71f6e7c39c feat(table-coordinates): add table coordinate utility module for OCR processing před 2 měsíci
device_utils.py a7520b9498 feat: 添加多个工具模块,包括设备检测、图像处理、HTML/Markdown 处理和数字解析功能 před 3 měsíci
file_utils.py 499120d8c4 refactor: Implement lazy loading for PDFUtils and extract_pdf_pages před 3 měsíci
html_generator.py d810bf44fc feat: Add output formatter v2 and PDF extraction utilities před 3 měsíci
html_utils.py a7520b9498 feat: 添加多个工具模块,包括设备检测、图像处理、HTML/Markdown 处理和数字解析功能 před 3 měsíci
image_utils.py e92c162db4 feat(新增水印检测和去除功能): 添加水印检测和去除的兼容别名,迁移至水印工具模块 před 1 týdnem
json_formatters.py 1ce742a4ef refactor(json_formatters): 移除冗余的金额标准化逻辑,更新JSON输出以包含标准化变更记录 před 2 týdny
log_utils.py d810bf44fc feat: Add output formatter v2 and PDF extraction utilities před 3 měsíci
markdown_generator.py 40bad356ee refactor(markdown_generator): 移除冗余的金额标准化逻辑,更新Markdown生成以包含标准化变更说明 před 2 týdny
normalize_financial_numbers.py 24f1406736 feat(normalize_financial_numbers): 优化金额规范化逻辑,增加对纯整数和正确小数格式的直接返回处理 před 2 týdny
number_utils.py a7520b9498 feat: 添加多个工具模块,包括设备检测、图像处理、HTML/Markdown 处理和数字解析功能 před 3 měsíci
output_formatter_v2.py 11668f177e refactor(output_formatter_v2): 移除冗余的金额标准化逻辑,更新保存中间JSON的注释以反映标准化已在处理管道中完成 před 2 týdny
pdf_README.md f32729046f feat: 统一坐标系输出逻辑,增加return_upright_coords参数支持,优化文本提取功能 před 2 měsíci
pdf_coordinate_transform.py 712d004e85 refactor(pdf_coordinate_transform): remove outdated bbox transformation function před 2 měsíci
pdf_extractor.py 499120d8c4 refactor: Implement lazy loading for PDFUtils and extract_pdf_pages před 3 měsíci
pdf_image_rendering.py 58d9568b0f feat: add PDF text extraction module and refactor PDF utilities před 2 měsíci
pdf_text_extraction.py f32729046f feat: 统一坐标系输出逻辑,增加return_upright_coords参数支持,优化文本提取功能 před 2 měsíci
pdf_utils.py b6b75a00ba feat(新增PDF字节数据支持): 在PDFUtils中添加可选的pdf_bytes参数,支持内存中预处理后的PDF加载 před 1 týdnem
visualization_utils.py a7520b9498 feat: 添加多个工具模块,包括设备检测、图像处理、HTML/Markdown 处理和数字解析功能 před 3 měsíci
watermark_utils.py 7fa6ad09bb feat(新增水印处理工具模块): 添加图像级和PDF层级水印检测与去除功能,支持多种输入格式 před 1 týdnem