Commit History

Auteur SHA1 Bericht Datum
  zhch158_admin d7e042807c feat(优化调试选项合并): 在PaddleTableClassifier类中更新debug_options合并逻辑,添加default_subdir参数以支持默认子目录配置,提升调试输出路径的灵活性和可维护性。 5 dagen geleden
  zhch158_admin 5a5b23b3a0 feat(优化调试选项合并): 在MinerUWiredTableRecognizer类中更新debug_options合并逻辑,添加default_subdir参数以支持默认子目录配置,提升调试输出路径的灵活性和可维护性。 5 dagen geleden
  zhch158_admin 07852d2774 fix(调整水印去除阈值): 更新水印去除功能中的阈值设置,从160调整为175,并添加注释说明对比度增强的依赖关系,以提升图像处理的准确性和可维护性。 5 dagen geleden
  zhch158_admin dec64903d5 feat(增强调试选项): 在BasePreprocessor和BaseLayoutDetector类中添加subdir参数,优化输出目录配置,提升调试过程的灵活性和可维护性。 5 dagen geleden
  zhch158_admin c06dc3fb13 fix(更新调试输出目录): 修改TextFiller类中的output_dir参数描述,更新单元格OCR调试目录路径,确保调试输出目录的清晰性和一致性。 5 dagen geleden
  zhch158_admin ada8334231 feat(增强调试工具): 在WiredTableDebugUtils类中添加resolve_debug_output_dir方法,优化调试选项合并逻辑,支持默认子目录配置,提升调试输出路径的灵活性和可维护性。 5 dagen geleden
  zhch158_admin 20b05456ab feat(增强调试功能): 在EnhancedDocPipeline类中添加_build_table_module_debug_override方法,以支持更灵活的调试选项构建,更新调试输出目录路径,优化表格模块的调试配置,提升调试过程的可定制性和准确性。 5 dagen geleden
  zhch158_admin bcc8a748b5 feat(增强布局路由器): 在SmartLayoutRouter中优化模型配置合并逻辑,添加debug_options支持,更新调试输出目录路径,提升调试过程的灵活性和准确性。 5 dagen geleden
  zhch158_admin b2e8f25369 feat(增强调试选项): 在ElementProcessors类中添加debug_options参数,以支持更灵活的调试配置,优化调试选项的构造逻辑,提升调试过程的可定制性和准确性。 5 dagen geleden
  zhch158_admin adafec6488 fix(调整调试输出目录): 更新remove_watermark.py中的调试输出目录路径,从debug_comparison/watermark_removal/更改为debug/watermark_removal/,以统一目录结构并提升可维护性。 5 dagen geleden
  zhch158_admin 3867618ad1 feat(更新银行流水配置): 禁用水印去除功能,添加对比度增强和调试选项,优化调试输出目录结构,提升配置的清晰度和可维护性。 5 dagen geleden
  zhch158_admin 6a6e6ba69b fix(更新配置): 禁用水印去除功能,调整调试输出目录结构以支持模块化调试,提升配置的清晰度和可维护性。 5 dagen geleden
  zhch158_admin 0ad77c44e3 feat(增强调试功能): 在配置中添加水印去除调试选项,优化输出配置以支持模块调试,更新示例输入和页面范围,提升调试过程的灵活性和准确性。 6 dagen geleden
  zhch158_admin 52b9065e9b feat(增强水印处理功能): 在watermark_utils.py中添加多个新函数以支持水印掩膜构建、动态阈值去水印、对比度增强和调试图保存,提升水印去除的灵活性和准确性。 6 dagen geleden
  zhch158_admin 9624e032a1 feat(新增模块级Debug可视化): 添加ocr_utils/module_debug_viz.py模块,提供布局和OCR调试图的绘制与保存功能,支持JSON输出,增强调试过程的可视化和审计能力。 6 dagen geleden
  zhch158_admin 57178ab8f2 feat(优化水印去除和方向校正): 增强remove_watermark方法以支持可选对比度增强,改进correct_orientation方法以处理PDF旋转和方向分类器,优化process方法以支持裁剪块处理,提升OCR图像预处理的灵活性和准确性。 6 dagen geleden
  zhch158_admin 1c67a0d785 feat(增强图像预处理): 在BasePreprocessor类中添加水印调试选项和图像处理顺序配置,优化方向校正和水印去除流程,提升OCR处理的灵活性和准确性。 6 dagen geleden
  zhch158_admin 92b9d902ee feat(增强布局路由器和文档管道): 在SmartLayoutRouter中添加布局调试上下文传播功能,优化模型检测流程;在EnhancedDocPipeline中改进页面预处理,注入水印调试上下文,增强OCR调试选项,提升处理灵活性和准确性。 6 dagen geleden
  zhch158_admin ad60ed5eca feat(更新银行流水配置): 修改bank_statement_glm_vl_local.yaml以禁用水印去除功能,更新bank_statement_yusys_local.yaml以增强水印处理配置,添加新参数和调试选项,提升处理灵活性和准确性。 6 dagen geleden
  zhch158_admin 5bbe299ec9 feat(优化水印去除工具): 更新remove_watermark.py,增强命令行参数支持,添加调试图保存功能,整合水印处理配置,提升处理灵活性和准确性。 6 dagen geleden
  zhch158_admin 35ee4abec4 feat(更新OCR文档配置): 修改OCR文档配置,更新输入文件、输出目录和配置文件路径,调整处理页面数量以支持新的文档格式。 1 week geleden
  zhch158_admin 5f33763ee3 feat(增强OCR框架): 在TextFiller类中添加新的配置参数以处理OCR框的宽度溢出和邻格重叠,优化跨单元格检测逻辑,提升文本填充的准确性。 1 week geleden
  zhch158_admin f32733271c feat(优化水印处理): 在图像预处理流程中添加页级水印去除功能,更新相关处理器以支持跳过水印选项,提升表格方向校正的准确性。 1 week geleden
  zhch158_admin 3e4d9ab6f0 feat(新增文档配置): 添加三个新的OCR文档配置文件,分别为陈3_微信图、彭_广东兴宁农村商业银行和钟_广东陆丰农村商业银行,定义了使用的OCR工具及其结果目录。 1 week geleden
  zhch158_admin 5263c0e66c fix(更新Python环境名称): 将测试文件中的Python环境名称从`mineru2`更新为`mineru`,确保一致性。 1 week geleden
  zhch158_admin 64ad4a204d fix(修复倾斜角度检测): 修改SkewDetector类中的cv2.fitLine返回值处理,确保返回值显式转为标量,并更新异常处理为错误日志记录。 1 week geleden
  zhch158_admin fb3ea48bb4 feat(新增银行交易流水场景配置): 添加银行交易流水V4场景配置,整合多种OCR识别功能及布局检测,支持有线和无线表格处理。 1 week geleden
  zhch158_admin 6518b09bbd fix(更新环境名称): 将所有配置和文档中的`mineru2`环境名称更新为`mineru`,确保一致性和准确性。 1 week geleden
  zhch158_admin 1262c510b7 fix(调整内容顺序): 调整payload.json中的内容顺序,确保图像URL在文本之前 1 maand geleden
  zhch158_admin 6a4c6d2098 fix(调整内容顺序): 修改curl_local_mineru.sh和curl_local_ocr.sh中的内容顺序,确保图像URL在文本之前 1 maand geleden