| .. |
|
wired_table
|
ac90e7c976
fix(优化文本填充逻辑): 更新TextFiller类中的文本填充逻辑,增加对OCR结果不完整的判断,优化返回的原因列表,提升OCR处理的准确性与灵活性。
|
hace 1 mes |
|
__init__.py
|
49a0fefc0e
feat(新增SealOCR识别器支持): 在适配器模块中引入SealOCRRecognizer,并更新BaseLayoutDetector类以处理印章类别的重叠情况,优化印章识别流程。
|
hace 1 mes |
|
_mineru_vl_patches.py
|
4e44a6c829
feat(新增mineru_vl_utils运行时补丁): 新增对PaddleOCR-VL的OTSL转换补丁,修复表格首格缺失前导结构token的问题,确保输出HTML中完整保留文本,提升文档解析的准确性与可靠性。同时在MinerUVLRecognizer初始化中应用该补丁,确保兼容性。
|
hace 1 mes |
|
base.py
|
49a0fefc0e
feat(新增SealOCR识别器支持): 在适配器模块中引入SealOCRRecognizer,并更新BaseLayoutDetector类以处理印章类别的重叠情况,优化印章识别流程。
|
hace 1 mes |
|
dit_layout_adapter.py
|
e686a07103
feat(layout_detection): enhance layout detection with new methods and post-processing
|
hace 5 meses |
|
docling_layout_adapter.py
|
e686a07103
feat(layout_detection): enhance layout detection with new methods and post-processing
|
hace 5 meses |
|
glmocr_vl_adapter.py
|
6d0491be49
fix(glmocr_vl_adapter): 更新模型参数以提高识别性能,调整最大令牌数、温度、top_p 和 top_k 值
|
hace 4 meses |
|
mineru_adapter.py
|
4e44a6c829
feat(新增mineru_vl_utils运行时补丁): 新增对PaddleOCR-VL的OTSL转换补丁,修复表格首格缺失前导结构token的问题,确保输出HTML中完整保留文本,提升文档解析的准确性与可靠性。同时在MinerUVLRecognizer初始化中应用该补丁,确保兼容性。
|
hace 1 mes |
|
mineru_wired_table.py
|
a8ca9d4dc3
fix(优化二次OCR逻辑与参数): 更新二次OCR处理逻辑,增加对空单元格的判断,优化匹配框的使用,提升银行流水模式下的OCR准确性。同时调整相关测试用例以验证新逻辑的有效性。
|
hace 1 mes |
|
paddle_layout_detector.py
|
cb83d24f8c
feat(更新布局检测器与新增印章OCR适配器): 修改PaddleLayoutDetector和PPDocLayoutV3Detector类的类别映射,优化印章和图表的处理逻辑,同时新增SealOCRRecognizer适配器以支持印章OCR识别,提升文档解析与印章识别能力。
|
hace 1 mes |
|
paddle_table_classifier.py
|
d7e042807c
feat(优化调试选项合并): 在PaddleTableClassifier类中更新debug_options合并逻辑,添加default_subdir参数以支持默认子目录配置,提升调试输出路径的灵活性和可维护性。
|
hace 1 mes |
|
paddle_vl_adapter.py
|
d560cc01e0
fix(paddle_vl_adapter): update model name retrieval logic to ensure default value is used
|
hace 5 meses |
|
paddle_wired_table_cells_detector.py
|
7db42f9eb6
feat(paddle_wired_table_cells_detector): 添加 ONNX 版本的有线表格单元格检测器
|
hace 5 meses |
|
pp_doclayout_v3_layout_adapter.py
|
cb83d24f8c
feat(更新布局检测器与新增印章OCR适配器): 修改PaddleLayoutDetector和PPDocLayoutV3Detector类的类别映射,优化印章和图表的处理逻辑,同时新增SealOCRRecognizer适配器以支持印章OCR识别,提升文档解析与印章识别能力。
|
hace 1 mes |
|
seal_ocr_adapter.py
|
cb83d24f8c
feat(更新布局检测器与新增印章OCR适配器): 修改PaddleLayoutDetector和PPDocLayoutV3Detector类的类别映射,优化印章和图表的处理逻辑,同时新增SealOCRRecognizer适配器以支持印章OCR识别,提升文档解析与印章识别能力。
|
hace 1 mes |