zhch158_admin
|
6f98aaba58
feat(优化银行对账单水印去除与单元格二次OCR配置): 更新bank_statement_yusys_local.yaml,简化水印去除配置,增强对水印检测的支持,新增单元格预处理选项,提升OCR处理的灵活性和准确性。
|
4 gün önce |
zhch158_admin
|
0ba1d33741
feat(增强水印去除工具的配置与处理能力): 更新remove_watermark.py,重构水印设置加载逻辑,支持根据scope参数选择不同的水印配置,新增WatermarkProcessor类以优化水印去除过程,提升OCR处理的灵活性和准确性。
|
4 gün önce |
zhch158_admin
|
130984410f
feat(新增单元格预处理与参数扫描功能): 在ocr_tools/cell_preprocess_lab中新增cell_preprocess_lab.py和cell121_sweep.py文件,分别实现单元格裁剪图的预处理流程和参数扫描功能,支持去水印、去噪、对比度调整及OCR识别,提升OCR处理的灵活性和准确性。
|
4 gün önce |
zhch158_admin
|
e2bb737026
feat(新增单元格匹配框处理单元测试): 在test_second_pass_ocr_aggregate.py中新增TestResolveCellMatchedBoxes类,包含多个测试用例以验证单元格匹配框的处理逻辑,确保在不同情况下的文本填充和分数计算的准确性,提升OCR处理的可靠性和可维护性。
|
5 gün önce |
zhch158_admin
|
fdef502446
feat(添加虚线段绘制功能): 在module_debug_viz.py中新增虚线段绘制函数,支持在OCR span无文本时使用虚线框显示,提升可视化效果和调试灵活性。
|
5 gün önce |
zhch158_admin
|
398929fec5
fix(修复无效ocr_poly处理逻辑): 注释掉无效的ocr_poly和文本检查逻辑,确保在ocr_poly为空时返回None,提升代码的健壮性和可读性。
|
5 gün önce |
zhch158_admin
|
3099890b65
feat(增强文本填充逻辑与边界框处理): 更新TextFiller类中的文本填充逻辑,确保在文本为空时返回0分数;新增多个静态方法以处理边界框的面积计算、嵌套框的识别和调试标签生成,提升OCR处理的准确性和可维护性。
|
5 gün önce |
zhch158_admin
|
8e61a877b0
feat(添加二次OCR聚合与择优逻辑单元测试): 新增针对二次OCR的聚合、择优逻辑及调试功能的单元测试,提升OCR处理的准确性和可维护性。
|
5 gün önce |
zhch158_admin
|
5511510558
feat(增强单元格OCR调试功能): 在MinerUWiredTableRecognizer类中添加debug_prefix参数,以支持更灵活的调试输出,提升OCR处理的可追踪性和调试效率。
|
5 gün önce |
zhch158_admin
|
815592687a
feat(添加单元格二次OCR配置): 在多个银行对账单配置文件中添加second_pass_ocr选项,增强OCR处理能力,支持低分块过滤和整格兜底,提高文本识别的准确性和灵活性。
|
5 gün önce |
zhch158_admin
|
cde2fb8faa
fix(更新水印去除调试函数): 修改save_watermark_removal_debug函数以统一调试输出目录结构,更新文档描述和参数,确保与module debug一致,提升调试过程的清晰性和一致性。
|
5 gün önce |
zhch158_admin
|
8427034b4c
feat(优化调试输出目录): 添加resolve_module_debug_dir函数以统一调试输出目录结构,更新相关函数以支持新的目录路径,提升调试过程的灵活性和可维护性。
|
5 gün önce |
zhch158_admin
|
d7e042807c
feat(优化调试选项合并): 在PaddleTableClassifier类中更新debug_options合并逻辑,添加default_subdir参数以支持默认子目录配置,提升调试输出路径的灵活性和可维护性。
|
5 gün önce |
zhch158_admin
|
5a5b23b3a0
feat(优化调试选项合并): 在MinerUWiredTableRecognizer类中更新debug_options合并逻辑,添加default_subdir参数以支持默认子目录配置,提升调试输出路径的灵活性和可维护性。
|
5 gün önce |
zhch158_admin
|
07852d2774
fix(调整水印去除阈值): 更新水印去除功能中的阈值设置,从160调整为175,并添加注释说明对比度增强的依赖关系,以提升图像处理的准确性和可维护性。
|
5 gün önce |
zhch158_admin
|
dec64903d5
feat(增强调试选项): 在BasePreprocessor和BaseLayoutDetector类中添加subdir参数,优化输出目录配置,提升调试过程的灵活性和可维护性。
|
5 gün önce |
zhch158_admin
|
c06dc3fb13
fix(更新调试输出目录): 修改TextFiller类中的output_dir参数描述,更新单元格OCR调试目录路径,确保调试输出目录的清晰性和一致性。
|
5 gün önce |
zhch158_admin
|
ada8334231
feat(增强调试工具): 在WiredTableDebugUtils类中添加resolve_debug_output_dir方法,优化调试选项合并逻辑,支持默认子目录配置,提升调试输出路径的灵活性和可维护性。
|
5 gün önce |
zhch158_admin
|
20b05456ab
feat(增强调试功能): 在EnhancedDocPipeline类中添加_build_table_module_debug_override方法,以支持更灵活的调试选项构建,更新调试输出目录路径,优化表格模块的调试配置,提升调试过程的可定制性和准确性。
|
5 gün önce |
zhch158_admin
|
bcc8a748b5
feat(增强布局路由器): 在SmartLayoutRouter中优化模型配置合并逻辑,添加debug_options支持,更新调试输出目录路径,提升调试过程的灵活性和准确性。
|
5 gün önce |
zhch158_admin
|
b2e8f25369
feat(增强调试选项): 在ElementProcessors类中添加debug_options参数,以支持更灵活的调试配置,优化调试选项的构造逻辑,提升调试过程的可定制性和准确性。
|
5 gün önce |
zhch158_admin
|
adafec6488
fix(调整调试输出目录): 更新remove_watermark.py中的调试输出目录路径,从debug_comparison/watermark_removal/更改为debug/watermark_removal/,以统一目录结构并提升可维护性。
|
5 gün önce |
zhch158_admin
|
3867618ad1
feat(更新银行流水配置): 禁用水印去除功能,添加对比度增强和调试选项,优化调试输出目录结构,提升配置的清晰度和可维护性。
|
5 gün önce |
zhch158_admin
|
6a6e6ba69b
fix(更新配置): 禁用水印去除功能,调整调试输出目录结构以支持模块化调试,提升配置的清晰度和可维护性。
|
5 gün önce |
zhch158_admin
|
0ad77c44e3
feat(增强调试功能): 在配置中添加水印去除调试选项,优化输出配置以支持模块调试,更新示例输入和页面范围,提升调试过程的灵活性和准确性。
|
6 gün önce |
zhch158_admin
|
52b9065e9b
feat(增强水印处理功能): 在watermark_utils.py中添加多个新函数以支持水印掩膜构建、动态阈值去水印、对比度增强和调试图保存,提升水印去除的灵活性和准确性。
|
6 gün önce |
zhch158_admin
|
9624e032a1
feat(新增模块级Debug可视化): 添加ocr_utils/module_debug_viz.py模块,提供布局和OCR调试图的绘制与保存功能,支持JSON输出,增强调试过程的可视化和审计能力。
|
6 gün önce |
zhch158_admin
|
57178ab8f2
feat(优化水印去除和方向校正): 增强remove_watermark方法以支持可选对比度增强,改进correct_orientation方法以处理PDF旋转和方向分类器,优化process方法以支持裁剪块处理,提升OCR图像预处理的灵活性和准确性。
|
6 gün önce |
zhch158_admin
|
1c67a0d785
feat(增强图像预处理): 在BasePreprocessor类中添加水印调试选项和图像处理顺序配置,优化方向校正和水印去除流程,提升OCR处理的灵活性和准确性。
|
6 gün önce |
zhch158_admin
|
92b9d902ee
feat(增强布局路由器和文档管道): 在SmartLayoutRouter中添加布局调试上下文传播功能,优化模型检测流程;在EnhancedDocPipeline中改进页面预处理,注入水印调试上下文,增强OCR调试选项,提升处理灵活性和准确性。
|
6 gün önce |