zhch158_admin 5f33763ee3 feat(增强OCR框架): 在TextFiller类中添加新的配置参数以处理OCR框的宽度溢出和邻格重叠,优化跨单元格检测逻辑,提升文本填充的准确性。 2 hari lalu
..
wired_table 5f33763ee3 feat(增强OCR框架): 在TextFiller类中添加新的配置参数以处理OCR框的宽度溢出和邻格重叠,优化跨单元格检测逻辑,提升文本填充的准确性。 2 hari lalu
__init__.py 371113b468 feat(adapter): 添加 GLM-OCR 适配器支持,增强模型适配器功能 3 bulan lalu
base.py f32733271c feat(优化水印处理): 在图像预处理流程中添加页级水印去除功能,更新相关处理器以支持跳过水印选项,提升表格方向校正的准确性。 2 hari lalu
dit_layout_adapter.py e686a07103 feat(layout_detection): enhance layout detection with new methods and post-processing 4 bulan lalu
docling_layout_adapter.py e686a07103 feat(layout_detection): enhance layout detection with new methods and post-processing 4 bulan lalu
glmocr_vl_adapter.py 6d0491be49 fix(glmocr_vl_adapter): 更新模型参数以提高识别性能,调整最大令牌数、温度、top_p 和 top_k 值 3 bulan lalu
mineru_adapter.py f32733271c feat(优化水印处理): 在图像预处理流程中添加页级水印去除功能,更新相关处理器以支持跳过水印选项,提升表格方向校正的准确性。 2 hari lalu
mineru_wired_table.py 73f20ff9e2 feat(mineru_wired_table): 添加 OCR 文本容差计算,优化网格结构恢复 3 bulan lalu
paddle_layout_detector.py e686a07103 feat(layout_detection): enhance layout detection with new methods and post-processing 4 bulan lalu
paddle_table_classifier.py d2258858b5 feat(paddle_table_classifier): 优化表格线检测,使用自适应阈值和线段过滤 3 bulan lalu
paddle_vl_adapter.py d560cc01e0 fix(paddle_vl_adapter): update model name retrieval logic to ensure default value is used 4 bulan lalu
paddle_wired_table_cells_detector.py 7db42f9eb6 feat(paddle_wired_table_cells_detector): 添加 ONNX 版本的有线表格单元格检测器 3 bulan lalu
pp_doclayout_v3_layout_adapter.py b24aaa17be fix(adapter): 修改 seal 类别为独立类别,以支持 VLM 识别 3 bulan lalu