zhch158_admin 57178ab8f2 feat(优化水印去除和方向校正): 增强remove_watermark方法以支持可选对比度增强,改进correct_orientation方法以处理PDF旋转和方向分类器,优化process方法以支持裁剪块处理,提升OCR图像预处理的灵活性和准确性。 6 өдөр өмнө
..
wired_table 5f33763ee3 feat(增强OCR框架): 在TextFiller类中添加新的配置参数以处理OCR框的宽度溢出和邻格重叠,优化跨单元格检测逻辑,提升文本填充的准确性。 1 долоо хоног өмнө
__init__.py 371113b468 feat(adapter): 添加 GLM-OCR 适配器支持,增强模型适配器功能 3 сар өмнө
base.py 1c67a0d785 feat(增强图像预处理): 在BasePreprocessor类中添加水印调试选项和图像处理顺序配置,优化方向校正和水印去除流程,提升OCR处理的灵活性和准确性。 6 өдөр өмнө
dit_layout_adapter.py e686a07103 feat(layout_detection): enhance layout detection with new methods and post-processing 4 сар өмнө
docling_layout_adapter.py e686a07103 feat(layout_detection): enhance layout detection with new methods and post-processing 4 сар өмнө
glmocr_vl_adapter.py 6d0491be49 fix(glmocr_vl_adapter): 更新模型参数以提高识别性能,调整最大令牌数、温度、top_p 和 top_k 值 3 сар өмнө
mineru_adapter.py 57178ab8f2 feat(优化水印去除和方向校正): 增强remove_watermark方法以支持可选对比度增强,改进correct_orientation方法以处理PDF旋转和方向分类器,优化process方法以支持裁剪块处理,提升OCR图像预处理的灵活性和准确性。 6 өдөр өмнө
mineru_wired_table.py 73f20ff9e2 feat(mineru_wired_table): 添加 OCR 文本容差计算,优化网格结构恢复 3 сар өмнө
paddle_layout_detector.py e686a07103 feat(layout_detection): enhance layout detection with new methods and post-processing 4 сар өмнө
paddle_table_classifier.py d2258858b5 feat(paddle_table_classifier): 优化表格线检测,使用自适应阈值和线段过滤 3 сар өмнө
paddle_vl_adapter.py d560cc01e0 fix(paddle_vl_adapter): update model name retrieval logic to ensure default value is used 4 сар өмнө
paddle_wired_table_cells_detector.py 7db42f9eb6 feat(paddle_wired_table_cells_detector): 添加 ONNX 版本的有线表格单元格检测器 3 сар өмнө
pp_doclayout_v3_layout_adapter.py b24aaa17be fix(adapter): 修改 seal 类别为独立类别,以支持 VLM 识别 3 сар өмнө