zhch158_admin
|
07852d2774
fix(调整水印去除阈值): 更新水印去除功能中的阈值设置,从160调整为175,并添加注释说明对比度增强的依赖关系,以提升图像处理的准确性和可维护性。
|
5 days ago |
zhch158_admin
|
dec64903d5
feat(增强调试选项): 在BasePreprocessor和BaseLayoutDetector类中添加subdir参数,优化输出目录配置,提升调试过程的灵活性和可维护性。
|
5 days ago |
zhch158_admin
|
c06dc3fb13
fix(更新调试输出目录): 修改TextFiller类中的output_dir参数描述,更新单元格OCR调试目录路径,确保调试输出目录的清晰性和一致性。
|
5 days ago |
zhch158_admin
|
ada8334231
feat(增强调试工具): 在WiredTableDebugUtils类中添加resolve_debug_output_dir方法,优化调试选项合并逻辑,支持默认子目录配置,提升调试输出路径的灵活性和可维护性。
|
5 days ago |
zhch158_admin
|
20b05456ab
feat(增强调试功能): 在EnhancedDocPipeline类中添加_build_table_module_debug_override方法,以支持更灵活的调试选项构建,更新调试输出目录路径,优化表格模块的调试配置,提升调试过程的可定制性和准确性。
|
5 days ago |
zhch158_admin
|
bcc8a748b5
feat(增强布局路由器): 在SmartLayoutRouter中优化模型配置合并逻辑,添加debug_options支持,更新调试输出目录路径,提升调试过程的灵活性和准确性。
|
5 days ago |
zhch158_admin
|
b2e8f25369
feat(增强调试选项): 在ElementProcessors类中添加debug_options参数,以支持更灵活的调试配置,优化调试选项的构造逻辑,提升调试过程的可定制性和准确性。
|
5 days ago |
zhch158_admin
|
adafec6488
fix(调整调试输出目录): 更新remove_watermark.py中的调试输出目录路径,从debug_comparison/watermark_removal/更改为debug/watermark_removal/,以统一目录结构并提升可维护性。
|
5 days ago |
zhch158_admin
|
3867618ad1
feat(更新银行流水配置): 禁用水印去除功能,添加对比度增强和调试选项,优化调试输出目录结构,提升配置的清晰度和可维护性。
|
5 days ago |
zhch158_admin
|
6a6e6ba69b
fix(更新配置): 禁用水印去除功能,调整调试输出目录结构以支持模块化调试,提升配置的清晰度和可维护性。
|
5 days ago |
zhch158_admin
|
0ad77c44e3
feat(增强调试功能): 在配置中添加水印去除调试选项,优化输出配置以支持模块调试,更新示例输入和页面范围,提升调试过程的灵活性和准确性。
|
5 days ago |
zhch158_admin
|
52b9065e9b
feat(增强水印处理功能): 在watermark_utils.py中添加多个新函数以支持水印掩膜构建、动态阈值去水印、对比度增强和调试图保存,提升水印去除的灵活性和准确性。
|
5 days ago |
zhch158_admin
|
9624e032a1
feat(新增模块级Debug可视化): 添加ocr_utils/module_debug_viz.py模块,提供布局和OCR调试图的绘制与保存功能,支持JSON输出,增强调试过程的可视化和审计能力。
|
5 days ago |
zhch158_admin
|
57178ab8f2
feat(优化水印去除和方向校正): 增强remove_watermark方法以支持可选对比度增强,改进correct_orientation方法以处理PDF旋转和方向分类器,优化process方法以支持裁剪块处理,提升OCR图像预处理的灵活性和准确性。
|
5 days ago |
zhch158_admin
|
1c67a0d785
feat(增强图像预处理): 在BasePreprocessor类中添加水印调试选项和图像处理顺序配置,优化方向校正和水印去除流程,提升OCR处理的灵活性和准确性。
|
5 days ago |
zhch158_admin
|
92b9d902ee
feat(增强布局路由器和文档管道): 在SmartLayoutRouter中添加布局调试上下文传播功能,优化模型检测流程;在EnhancedDocPipeline中改进页面预处理,注入水印调试上下文,增强OCR调试选项,提升处理灵活性和准确性。
|
5 days ago |
zhch158_admin
|
ad60ed5eca
feat(更新银行流水配置): 修改bank_statement_glm_vl_local.yaml以禁用水印去除功能,更新bank_statement_yusys_local.yaml以增强水印处理配置,添加新参数和调试选项,提升处理灵活性和准确性。
|
5 days ago |
zhch158_admin
|
5bbe299ec9
feat(优化水印去除工具): 更新remove_watermark.py,增强命令行参数支持,添加调试图保存功能,整合水印处理配置,提升处理灵活性和准确性。
|
5 days ago |
zhch158_admin
|
35ee4abec4
feat(更新OCR文档配置): 修改OCR文档配置,更新输入文件、输出目录和配置文件路径,调整处理页面数量以支持新的文档格式。
|
1 week ago |
zhch158_admin
|
5f33763ee3
feat(增强OCR框架): 在TextFiller类中添加新的配置参数以处理OCR框的宽度溢出和邻格重叠,优化跨单元格检测逻辑,提升文本填充的准确性。
|
1 week ago |
zhch158_admin
|
f32733271c
feat(优化水印处理): 在图像预处理流程中添加页级水印去除功能,更新相关处理器以支持跳过水印选项,提升表格方向校正的准确性。
|
1 week ago |
zhch158_admin
|
3e4d9ab6f0
feat(新增文档配置): 添加三个新的OCR文档配置文件,分别为陈3_微信图、彭_广东兴宁农村商业银行和钟_广东陆丰农村商业银行,定义了使用的OCR工具及其结果目录。
|
1 week ago |
zhch158_admin
|
5263c0e66c
fix(更新Python环境名称): 将测试文件中的Python环境名称从`mineru2`更新为`mineru`,确保一致性。
|
1 week ago |
zhch158_admin
|
64ad4a204d
fix(修复倾斜角度检测): 修改SkewDetector类中的cv2.fitLine返回值处理,确保返回值显式转为标量,并更新异常处理为错误日志记录。
|
1 week ago |
zhch158_admin
|
fb3ea48bb4
feat(新增银行交易流水场景配置): 添加银行交易流水V4场景配置,整合多种OCR识别功能及布局检测,支持有线和无线表格处理。
|
1 week ago |
zhch158_admin
|
6518b09bbd
fix(更新环境名称): 将所有配置和文档中的`mineru2`环境名称更新为`mineru`,确保一致性和准确性。
|
1 week ago |
zhch158_admin
|
1262c510b7
fix(调整内容顺序): 调整payload.json中的内容顺序,确保图像URL在文本之前
|
1 month ago |
zhch158_admin
|
6a4c6d2098
fix(调整内容顺序): 修改curl_local_mineru.sh和curl_local_ocr.sh中的内容顺序,确保图像URL在文本之前
|
1 month ago |
zhch158_admin
|
eee7efd233
fix(更新示例配置): 修改示例配置文件,更新输入文件、输出目录和日志文件路径
|
1 month ago |
zhch158_admin
|
ad99559dd2
fix(删除银行交易流水配置): 移除冗余的银行交易流水场景配置文件
|
1 month ago |