zhch158_admin b68a0e5003 feat(新增二次OCR处理与测试用例): 在test_second_pass_ocr_aggregate.py中新增多个测试类和用例,验证整体OCR处理逻辑,包括短文本高分触发整体OCR和空行触发逻辑,增强对银行对账单的二次OCR触发条件的测试,提升OCR处理的准确性和可靠性。 4 днів тому
..
config 6f98aaba58 feat(优化银行对账单水印去除与单元格二次OCR配置): 更新bank_statement_yusys_local.yaml,简化水印去除配置,增强对水印检测的支持,新增单元格预处理选项,提升OCR处理的灵活性和准确性。 4 днів тому
core 398929fec5 fix(修复无效ocr_poly处理逻辑): 注释掉无效的ocr_poly和文本检查逻辑,确保在ocr_poly为空时返回None,提升代码的健壮性和可读性。 4 днів тому
dit_support 20d936e629 feat: 新增 DiT 支持模块及其核心功能 5 місяців тому
models 9dd99bce76 feat(优化水印处理与OCR逻辑): 重构MinerUPreprocessor类以整合WatermarkProcessor,简化水印去除流程并增强对比度调整功能,同时更新MinerUWiredTableRecognizer类以支持更灵活的单元格OCR处理,提升整体OCR准确性与灵活性。 4 днів тому
tests b68a0e5003 feat(新增二次OCR处理与测试用例): 在test_second_pass_ocr_aggregate.py中新增多个测试类和用例,验证整体OCR处理逻辑,包括短文本高分触发整体OCR和空行触发逻辑,增强对银行对账单的二次OCR触发条件的测试,提升OCR处理的准确性和可靠性。 4 днів тому
utils 9733ac0b36 feat: 更新多个工具的 README 文档,添加详细文档链接 5 місяців тому
__init__.py 565ef479fa feat: Implement universal document parser with enhanced processing capabilities 5 місяців тому
main_v2.py 0ad77c44e3 feat(增强调试功能): 在配置中添加水印去除调试选项,优化输出配置以支持模块调试,更新示例输入和页面范围,提升调试过程的灵活性和准确性。 5 днів тому