Historia zmian

Autor SHA1 Wiadomość Data
  zhch158_admin fdef502446 feat(添加虚线段绘制功能): 在module_debug_viz.py中新增虚线段绘制函数,支持在OCR span无文本时使用虚线框显示,提升可视化效果和调试灵活性。 4 dni temu
  zhch158_admin 398929fec5 fix(修复无效ocr_poly处理逻辑): 注释掉无效的ocr_poly和文本检查逻辑,确保在ocr_poly为空时返回None,提升代码的健壮性和可读性。 4 dni temu
  zhch158_admin 3099890b65 feat(增强文本填充逻辑与边界框处理): 更新TextFiller类中的文本填充逻辑,确保在文本为空时返回0分数;新增多个静态方法以处理边界框的面积计算、嵌套框的识别和调试标签生成,提升OCR处理的准确性和可维护性。 4 dni temu
  zhch158_admin 8e61a877b0 feat(添加二次OCR聚合与择优逻辑单元测试): 新增针对二次OCR的聚合、择优逻辑及调试功能的单元测试,提升OCR处理的准确性和可维护性。 5 dni temu
  zhch158_admin 5511510558 feat(增强单元格OCR调试功能): 在MinerUWiredTableRecognizer类中添加debug_prefix参数,以支持更灵活的调试输出,提升OCR处理的可追踪性和调试效率。 5 dni temu
  zhch158_admin 815592687a feat(添加单元格二次OCR配置): 在多个银行对账单配置文件中添加second_pass_ocr选项,增强OCR处理能力,支持低分块过滤和整格兜底,提高文本识别的准确性和灵活性。 5 dni temu
  zhch158_admin cde2fb8faa fix(更新水印去除调试函数): 修改save_watermark_removal_debug函数以统一调试输出目录结构,更新文档描述和参数,确保与module debug一致,提升调试过程的清晰性和一致性。 5 dni temu
  zhch158_admin 8427034b4c feat(优化调试输出目录): 添加resolve_module_debug_dir函数以统一调试输出目录结构,更新相关函数以支持新的目录路径,提升调试过程的灵活性和可维护性。 5 dni temu
  zhch158_admin d7e042807c feat(优化调试选项合并): 在PaddleTableClassifier类中更新debug_options合并逻辑,添加default_subdir参数以支持默认子目录配置,提升调试输出路径的灵活性和可维护性。 5 dni temu
  zhch158_admin 5a5b23b3a0 feat(优化调试选项合并): 在MinerUWiredTableRecognizer类中更新debug_options合并逻辑,添加default_subdir参数以支持默认子目录配置,提升调试输出路径的灵活性和可维护性。 5 dni temu
  zhch158_admin 07852d2774 fix(调整水印去除阈值): 更新水印去除功能中的阈值设置,从160调整为175,并添加注释说明对比度增强的依赖关系,以提升图像处理的准确性和可维护性。 5 dni temu
  zhch158_admin dec64903d5 feat(增强调试选项): 在BasePreprocessor和BaseLayoutDetector类中添加subdir参数,优化输出目录配置,提升调试过程的灵活性和可维护性。 5 dni temu
  zhch158_admin c06dc3fb13 fix(更新调试输出目录): 修改TextFiller类中的output_dir参数描述,更新单元格OCR调试目录路径,确保调试输出目录的清晰性和一致性。 5 dni temu
  zhch158_admin ada8334231 feat(增强调试工具): 在WiredTableDebugUtils类中添加resolve_debug_output_dir方法,优化调试选项合并逻辑,支持默认子目录配置,提升调试输出路径的灵活性和可维护性。 5 dni temu
  zhch158_admin 20b05456ab feat(增强调试功能): 在EnhancedDocPipeline类中添加_build_table_module_debug_override方法,以支持更灵活的调试选项构建,更新调试输出目录路径,优化表格模块的调试配置,提升调试过程的可定制性和准确性。 5 dni temu
  zhch158_admin bcc8a748b5 feat(增强布局路由器): 在SmartLayoutRouter中优化模型配置合并逻辑,添加debug_options支持,更新调试输出目录路径,提升调试过程的灵活性和准确性。 5 dni temu
  zhch158_admin b2e8f25369 feat(增强调试选项): 在ElementProcessors类中添加debug_options参数,以支持更灵活的调试配置,优化调试选项的构造逻辑,提升调试过程的可定制性和准确性。 5 dni temu
  zhch158_admin adafec6488 fix(调整调试输出目录): 更新remove_watermark.py中的调试输出目录路径,从debug_comparison/watermark_removal/更改为debug/watermark_removal/,以统一目录结构并提升可维护性。 5 dni temu
  zhch158_admin 3867618ad1 feat(更新银行流水配置): 禁用水印去除功能,添加对比度增强和调试选项,优化调试输出目录结构,提升配置的清晰度和可维护性。 5 dni temu
  zhch158_admin 6a6e6ba69b fix(更新配置): 禁用水印去除功能,调整调试输出目录结构以支持模块化调试,提升配置的清晰度和可维护性。 5 dni temu
  zhch158_admin 0ad77c44e3 feat(增强调试功能): 在配置中添加水印去除调试选项,优化输出配置以支持模块调试,更新示例输入和页面范围,提升调试过程的灵活性和准确性。 5 dni temu
  zhch158_admin 52b9065e9b feat(增强水印处理功能): 在watermark_utils.py中添加多个新函数以支持水印掩膜构建、动态阈值去水印、对比度增强和调试图保存,提升水印去除的灵活性和准确性。 5 dni temu
  zhch158_admin 9624e032a1 feat(新增模块级Debug可视化): 添加ocr_utils/module_debug_viz.py模块,提供布局和OCR调试图的绘制与保存功能,支持JSON输出,增强调试过程的可视化和审计能力。 5 dni temu
  zhch158_admin 57178ab8f2 feat(优化水印去除和方向校正): 增强remove_watermark方法以支持可选对比度增强,改进correct_orientation方法以处理PDF旋转和方向分类器,优化process方法以支持裁剪块处理,提升OCR图像预处理的灵活性和准确性。 5 dni temu
  zhch158_admin 1c67a0d785 feat(增强图像预处理): 在BasePreprocessor类中添加水印调试选项和图像处理顺序配置,优化方向校正和水印去除流程,提升OCR处理的灵活性和准确性。 5 dni temu
  zhch158_admin 92b9d902ee feat(增强布局路由器和文档管道): 在SmartLayoutRouter中添加布局调试上下文传播功能,优化模型检测流程;在EnhancedDocPipeline中改进页面预处理,注入水印调试上下文,增强OCR调试选项,提升处理灵活性和准确性。 5 dni temu
  zhch158_admin ad60ed5eca feat(更新银行流水配置): 修改bank_statement_glm_vl_local.yaml以禁用水印去除功能,更新bank_statement_yusys_local.yaml以增强水印处理配置,添加新参数和调试选项,提升处理灵活性和准确性。 5 dni temu
  zhch158_admin 5bbe299ec9 feat(优化水印去除工具): 更新remove_watermark.py,增强命令行参数支持,添加调试图保存功能,整合水印处理配置,提升处理灵活性和准确性。 5 dni temu
  zhch158_admin 35ee4abec4 feat(更新OCR文档配置): 修改OCR文档配置,更新输入文件、输出目录和配置文件路径,调整处理页面数量以支持新的文档格式。 1 tydzień temu
  zhch158_admin 5f33763ee3 feat(增强OCR框架): 在TextFiller类中添加新的配置参数以处理OCR框的宽度溢出和邻格重叠,优化跨单元格检测逻辑,提升文本填充的准确性。 1 tydzień temu