Histórico de Commits

Autor SHA1 Mensagem Data
  zhch158_admin 75d01a1ed5 feat(重构水印处理模块): 将水印处理功能从ocr_utils.watermark_utils迁移至ocr_utils.watermark子模块,新增水印检测、去除、对比度增强等功能,优化模块结构以提升可维护性和扩展性,同时保留与历史导入路径的兼容性。 há 4 dias atrás
  zhch158_admin 40b88e07b3 feat(新增水印处理单元测试): 在test_watermark_processor.py中新增多个测试用例,验证WatermarkProcessor和merge_watermark_config的功能,确保水印处理逻辑的准确性和可靠性。 há 4 dias atrás
  zhch158_admin b68a0e5003 feat(新增二次OCR处理与测试用例): 在test_second_pass_ocr_aggregate.py中新增多个测试类和用例,验证整体OCR处理逻辑,包括短文本高分触发整体OCR和空行触发逻辑,增强对银行对账单的二次OCR触发条件的测试,提升OCR处理的准确性和可靠性。 há 4 dias atrás
  zhch158_admin 9dd99bce76 feat(优化水印处理与OCR逻辑): 重构MinerUPreprocessor类以整合WatermarkProcessor,简化水印去除流程并增强对比度调整功能,同时更新MinerUWiredTableRecognizer类以支持更灵活的单元格OCR处理,提升整体OCR准确性与灵活性。 há 4 dias atrás
  zhch158_admin 73e783c91b feat(增强文本填充与OCR识别逻辑): 更新TextFiller类,新增多项配置选项以优化单元格OCR处理,重构识别逻辑以支持详细的行识别和边界框返回,提升OCR的准确性和灵活性。 há 4 dias atrás
  zhch158_admin 6f98aaba58 feat(优化银行对账单水印去除与单元格二次OCR配置): 更新bank_statement_yusys_local.yaml,简化水印去除配置,增强对水印检测的支持,新增单元格预处理选项,提升OCR处理的灵活性和准确性。 há 4 dias atrás
  zhch158_admin 0ba1d33741 feat(增强水印去除工具的配置与处理能力): 更新remove_watermark.py,重构水印设置加载逻辑,支持根据scope参数选择不同的水印配置,新增WatermarkProcessor类以优化水印去除过程,提升OCR处理的灵活性和准确性。 há 4 dias atrás
  zhch158_admin 130984410f feat(新增单元格预处理与参数扫描功能): 在ocr_tools/cell_preprocess_lab中新增cell_preprocess_lab.py和cell121_sweep.py文件,分别实现单元格裁剪图的预处理流程和参数扫描功能,支持去水印、去噪、对比度调整及OCR识别,提升OCR处理的灵活性和准确性。 há 4 dias atrás
  zhch158_admin e2bb737026 feat(新增单元格匹配框处理单元测试): 在test_second_pass_ocr_aggregate.py中新增TestResolveCellMatchedBoxes类,包含多个测试用例以验证单元格匹配框的处理逻辑,确保在不同情况下的文本填充和分数计算的准确性,提升OCR处理的可靠性和可维护性。 há 5 dias atrás
  zhch158_admin fdef502446 feat(添加虚线段绘制功能): 在module_debug_viz.py中新增虚线段绘制函数,支持在OCR span无文本时使用虚线框显示,提升可视化效果和调试灵活性。 há 5 dias atrás
  zhch158_admin 398929fec5 fix(修复无效ocr_poly处理逻辑): 注释掉无效的ocr_poly和文本检查逻辑,确保在ocr_poly为空时返回None,提升代码的健壮性和可读性。 há 5 dias atrás
  zhch158_admin 3099890b65 feat(增强文本填充逻辑与边界框处理): 更新TextFiller类中的文本填充逻辑,确保在文本为空时返回0分数;新增多个静态方法以处理边界框的面积计算、嵌套框的识别和调试标签生成,提升OCR处理的准确性和可维护性。 há 5 dias atrás
  zhch158_admin 8e61a877b0 feat(添加二次OCR聚合与择优逻辑单元测试): 新增针对二次OCR的聚合、择优逻辑及调试功能的单元测试,提升OCR处理的准确性和可维护性。 há 5 dias atrás
  zhch158_admin 5511510558 feat(增强单元格OCR调试功能): 在MinerUWiredTableRecognizer类中添加debug_prefix参数,以支持更灵活的调试输出,提升OCR处理的可追踪性和调试效率。 há 5 dias atrás
  zhch158_admin 815592687a feat(添加单元格二次OCR配置): 在多个银行对账单配置文件中添加second_pass_ocr选项,增强OCR处理能力,支持低分块过滤和整格兜底,提高文本识别的准确性和灵活性。 há 5 dias atrás
  zhch158_admin cde2fb8faa fix(更新水印去除调试函数): 修改save_watermark_removal_debug函数以统一调试输出目录结构,更新文档描述和参数,确保与module debug一致,提升调试过程的清晰性和一致性。 há 5 dias atrás
  zhch158_admin 8427034b4c feat(优化调试输出目录): 添加resolve_module_debug_dir函数以统一调试输出目录结构,更新相关函数以支持新的目录路径,提升调试过程的灵活性和可维护性。 há 5 dias atrás
  zhch158_admin d7e042807c feat(优化调试选项合并): 在PaddleTableClassifier类中更新debug_options合并逻辑,添加default_subdir参数以支持默认子目录配置,提升调试输出路径的灵活性和可维护性。 há 5 dias atrás
  zhch158_admin 5a5b23b3a0 feat(优化调试选项合并): 在MinerUWiredTableRecognizer类中更新debug_options合并逻辑,添加default_subdir参数以支持默认子目录配置,提升调试输出路径的灵活性和可维护性。 há 5 dias atrás
  zhch158_admin 07852d2774 fix(调整水印去除阈值): 更新水印去除功能中的阈值设置,从160调整为175,并添加注释说明对比度增强的依赖关系,以提升图像处理的准确性和可维护性。 há 5 dias atrás
  zhch158_admin dec64903d5 feat(增强调试选项): 在BasePreprocessor和BaseLayoutDetector类中添加subdir参数,优化输出目录配置,提升调试过程的灵活性和可维护性。 há 5 dias atrás
  zhch158_admin c06dc3fb13 fix(更新调试输出目录): 修改TextFiller类中的output_dir参数描述,更新单元格OCR调试目录路径,确保调试输出目录的清晰性和一致性。 há 5 dias atrás
  zhch158_admin ada8334231 feat(增强调试工具): 在WiredTableDebugUtils类中添加resolve_debug_output_dir方法,优化调试选项合并逻辑,支持默认子目录配置,提升调试输出路径的灵活性和可维护性。 há 5 dias atrás
  zhch158_admin 20b05456ab feat(增强调试功能): 在EnhancedDocPipeline类中添加_build_table_module_debug_override方法,以支持更灵活的调试选项构建,更新调试输出目录路径,优化表格模块的调试配置,提升调试过程的可定制性和准确性。 há 5 dias atrás
  zhch158_admin bcc8a748b5 feat(增强布局路由器): 在SmartLayoutRouter中优化模型配置合并逻辑,添加debug_options支持,更新调试输出目录路径,提升调试过程的灵活性和准确性。 há 5 dias atrás
  zhch158_admin b2e8f25369 feat(增强调试选项): 在ElementProcessors类中添加debug_options参数,以支持更灵活的调试配置,优化调试选项的构造逻辑,提升调试过程的可定制性和准确性。 há 5 dias atrás
  zhch158_admin adafec6488 fix(调整调试输出目录): 更新remove_watermark.py中的调试输出目录路径,从debug_comparison/watermark_removal/更改为debug/watermark_removal/,以统一目录结构并提升可维护性。 há 5 dias atrás
  zhch158_admin 3867618ad1 feat(更新银行流水配置): 禁用水印去除功能,添加对比度增强和调试选项,优化调试输出目录结构,提升配置的清晰度和可维护性。 há 5 dias atrás
  zhch158_admin 6a6e6ba69b fix(更新配置): 禁用水印去除功能,调整调试输出目录结构以支持模块化调试,提升配置的清晰度和可维护性。 há 5 dias atrás
  zhch158_admin 0ad77c44e3 feat(增强调试功能): 在配置中添加水印去除调试选项,优化输出配置以支持模块调试,更新示例输入和页面范围,提升调试过程的灵活性和准确性。 há 6 dias atrás