zhengchun

zhengchun извршује push на main у zhengchun/ocr_platform

  • fde9074e16 feat(新增Conda与uv包管理指南): 新增文档《Conda与uv包管理指南.md》,详细说明OCR Platform及MinerU项目的Python环境管理策略,推荐使用conda进行环境隔离,uv进行依赖安装,提升用户对环境配置的理解与使用指导。
  • 6034a94072 feat(更新本地OCR模型配置): 修改mineru_local_daemon.sh和paddle_local_daemon_1.6.sh中的模型路径,将模型更改为Q8_0版本,提升模型加载的效率与兼容性。
  • 29af42c4eb feat(更新本地OCR脚本): 修改curl_local_ocr.sh中的模型和端口配置,将模型更改为glm-ocr,并更新服务端口为8101,提升OCR服务的兼容性与稳定性。
  • 58a7281a79 feat(更新HF_safetensors到GGUF转换文档): 扩展HF_safetensors->GGUF.md文档,新增对ViT切割机制及投影器映射过程的详细解析,澄清量化对OCR精度的影响,提升用户对模型转换及使用的理解与指导。
  • Поређење ових 4 комита »

пре 4 недеља

zhengchun извршује push на main у zhengchun/ocr_platform

  • ddcf1e6a31 feat(更新HF_safetensors到GGUF转换文档): 扩展HF_safetensors->GGUF.md文档,详细阐述MinerU2.5-Pro的工作原理、各部件职责及数据流顺序,澄清核心误区,提升用户对文档解析流程的理解与应用指导。

пре 1 месец

zhengchun извршује push на main у zhengchun/ocr_platform

  • 9413ec2600 feat(更新MinerU本地OCR配置): 修改main_v2.py中的输出目录、配置文件和日志文件路径,以支持新的MinerU处理方式,提升文档解析的灵活性与准确性。
  • da4189fde7 feat(新增MinerU本地OCR配置): 在多个配置文件中新增对MinerU的支持,添加相应的工具、结果目录和描述信息,提升OCR框架的灵活性与可用性。
  • e4978b5cce feat(新增JSON序列化支持): 在module_debug_viz.py中新增_json_default函数,增强json.dumps的序列化能力,支持numpy标量/数组、集合和元组的序列化,提升调试信息的可读性与兼容性。
  • 0cb48eed12 feat(新增银行交易流水场景配置): 新增bank_statement_mineru_vl_local.yaml配置文件,支持银行交易流水和对账单的文档解析,包含输入输出参数、预处理、布局检测、OCR识别及表格分类等功能,提升文档解析的灵活性与准确性。
  • b599507513 feat(新增YUSYS本地OCR配置): 在processor_configs.yaml中新增yusys_mineruocr_local配置,支持本地文档解析,包含输入输出参数、额外参数及日志目录设置,提升OCR处理的灵活性与可用性。
  • Поређење ових 16 комита »

пре 1 месец

zhengchun извршује push на main у zhengchun/ocr_platform

  • 396ee1e6ec feat(优化OCR框颜色管理): 更新ocr_validator_layout.py,调整OCR框颜色获取方式,改为使用VisualizationUtils中的颜色映射,新增印章类别支持,提升布局结构框的可视化效果与一致性。
  • 0d0e8d028a feat(优化OCR框颜色管理): 在module_debug_viz.py中新增OCR框和印章框颜色获取函数,更新draw_ocr_spans_cv2函数以支持按类别动态着色,提升可视化效果;在output_formatter_v2.py中调整OCR框和单元格框颜色引用,确保一致性;在visualization_utils.py中完善颜色定义,增强模块间的可维护性。
  • 611a94104f feat(新增可视化颜色系统文档): 在README_COLOR_SYSTEM.md中新增可视化颜色系统设计文档,详细说明颜色定义、转换工具及模块间引用关系,提升项目可维护性与开发者理解。
  • Поређење ових 3 комита »

пре 1 месец

zhengchun извршује push на main у zhengchun/ocr_platform

  • 8bf66bc119 feat(增强印章OCR处理): 在ocr_validator_utils.py中新增对印章类别的支持,优化文本解析逻辑,添加印章相关信息的提取与处理,提升印章识别能力与数据解析的准确性。
  • 87b0f0a6e8 feat(增强OCR布局管理): 在ocr_validator_layout.py中新增类别颜色转换函数,优化边界框收集逻辑,支持按类别着色,提升可视化效果与用户体验。
  • 80d0437081 feat(更新可视化工具): 在visualization_utils.py中新增图表和印章的颜色定义,调整OCR框和单元格框的颜色为亮蓝,以提升可视化效果的一致性。
  • bcea502090 feat(增强布局绘制功能): 在module_debug_viz.py中新增印章和图表的颜色定义,优化绘制逻辑,添加OCR框收集功能,提升文档元素的可视化效果与识别能力。
  • cb83d24f8c feat(更新布局检测器与新增印章OCR适配器): 修改PaddleLayoutDetector和PPDocLayoutV3Detector类的类别映射,优化印章和图表的处理逻辑,同时新增SealOCRRecognizer适配器以支持印章OCR识别,提升文档解析与印章识别能力。
  • Поређење ових 13 комита »

пре 1 месец

zhengchun извршује push на main у zhengchun/ocr_platform

  • 4cd6801a2f fix(优化单元格OCR处理逻辑): 更新有线表格识别文档,详细说明二次OCR的核心设计与实现,增加对水印过滤、纵向完整性检测及列空判断的描述,提升OCR处理的准确性与灵活性。
  • e7d756752c fix(更新OCR示例路径): 修改main_v2.py中的OCR示例输入输出路径,更新为新的文件名和目录,以便于后续测试和使用。
  • ac90e7c976 fix(优化文本填充逻辑): 更新TextFiller类中的文本填充逻辑,增加对OCR结果不完整的判断,优化返回的原因列表,提升OCR处理的准确性与灵活性。
  • Поређење ових 3 комита »

пре 1 месец

zhengchun извршује push на main у zhengchun/ocr_platform

  • d817ad414b fix(优化二次OCR参数配置): 更新多个YAML配置文件中的二次OCR参数,调整水印去除、对比度增强及放大处理设置,以提升银行流水场景下的OCR处理准确性与灵活性。

пре 1 месец

zhengchun извршује push на main у zhengchun/ocr_platform

  • fd4a208147 fix(更新OCR参数示例): 修改main_v2.py中的OCR参数示例,调整页面处理范围为1页,并注释掉特定输入输出路径配置,以便于后续使用和测试。
  • a8ca9d4dc3 fix(优化二次OCR逻辑与参数): 更新二次OCR处理逻辑,增加对空单元格的判断,优化匹配框的使用,提升银行流水模式下的OCR准确性。同时调整相关测试用例以验证新逻辑的有效性。
  • db56c3775a fix(优化二次OCR参数配置): 更新bank_statement_yusys_local.yaml中的二次OCR参数,调整upscale_min_side的值以优化常规与低分场景下的OCR处理,提升整体识别准确性与灵活性。
  • 62bfdb256f feat(新增汇总推荐配置与批量扫描功能): 新增aggregate_recommendation.json文件以支持多案例的汇总推荐,更新cell_sweep.py以实现批量扫描和命中率统计功能,提升OCR处理的灵活性与准确性。同时新增sweep_cases.json文件以定义多个测试案例。
  • ba79f0c7d9 feat(新增多个单元格原始图像文件): 新增多个空白和带线条的单元格原始图像文件,以支持后续的OCR处理和实验。
  • Поређење ових 8 комита »

пре 1 месец

zhengchun извршује push на main у zhengchun/ocr_platform

  • 092154445c fix(优化水印去除配置): 更新bank_statement_glm_vl_local.yaml中的水印去除设置,启用检测前处理,调整对比度增强选项,提升OCR处理的准确性与灵活性。

пре 1 месец

zhengchun извршује push на main у zhengchun/ocr_platform

  • 01c5c02e94 feat(新增项目规则文件): 创建项目规则文件,明确所有回答需使用中文及开发运行时需激活`mineru`环境的要求,提升项目规范性与可维护性。
  • 937aab7790 fix(更新OCR结果对比路径与内容提取逻辑): 修改compare_ocr_results.py中的文件路径以适应新的数据源,同时在content_extractor.py中新增HTML注释移除功能,优化段落提取逻辑,提升OCR处理的准确性与灵活性。
  • 55ca99c249 feat(新增项目通用约定文档): 创建项目通用约定文档,明确使用简体中文进行交流及命令执行时需激活`mineru`环境的要求,提升项目规范性与可维护性。
  • Поређење ових 3 комита »

пре 1 месец

zhengchun извршује push на main у zhengchun/ocr_platform

  • b210ab056b fix(优化水印处理与布局检测配置): 更新多个bank_statement配置文件,调整水印去除设置,启用检测前处理,优化布局检测模块,新增OCR识别和表格分类功能,提升整体OCR处理的准确性与灵活性。
  • 70f36c0904 fix(调整水印处理与单元格预处理配置): 更新bank_statement_yusys_local.yaml中的水印处理方法和对比度增强设置,调整阈值和启用状态,以优化OCR处理效果和灵活性。
  • b11fe5592e fix(调整阈值以优化水印处理): 修改水印处理模块中的阈值设置,将单元格处理的阈值从170调整至155,以提升OCR处理的准确性和灵活性。
  • a2311846f1 feat(增强二次OCR处理与单元格预处理功能): 在test_second_pass_ocr_aggregate.py中新增测试类和用例,验证短文本最小字符配置、单元格预处理的对比度调整及水印处理逻辑,提升OCR处理的准确性与灵活性。
  • df98998bd5 feat(优化文本填充与OCR识别逻辑): 更新TextFiller类,新增短文本最小字符配置,重构识别逻辑以支持更灵活的文本解析和分数归一化,优化单元格对比度调整与增强功能,提升OCR处理的准确性与灵活性。
  • Поређење ових 8 комита »

пре 1 месец

zhengchun извршује push на main у zhengchun/ocr_platform

  • 75d01a1ed5 feat(重构水印处理模块): 将水印处理功能从ocr_utils.watermark_utils迁移至ocr_utils.watermark子模块,新增水印检测、去除、对比度增强等功能,优化模块结构以提升可维护性和扩展性,同时保留与历史导入路径的兼容性。
  • 40b88e07b3 feat(新增水印处理单元测试): 在test_watermark_processor.py中新增多个测试用例,验证WatermarkProcessor和merge_watermark_config的功能,确保水印处理逻辑的准确性和可靠性。
  • b68a0e5003 feat(新增二次OCR处理与测试用例): 在test_second_pass_ocr_aggregate.py中新增多个测试类和用例,验证整体OCR处理逻辑,包括短文本高分触发整体OCR和空行触发逻辑,增强对银行对账单的二次OCR触发条件的测试,提升OCR处理的准确性和可靠性。
  • 9dd99bce76 feat(优化水印处理与OCR逻辑): 重构MinerUPreprocessor类以整合WatermarkProcessor,简化水印去除流程并增强对比度调整功能,同时更新MinerUWiredTableRecognizer类以支持更灵活的单元格OCR处理,提升整体OCR准确性与灵活性。
  • 73e783c91b feat(增强文本填充与OCR识别逻辑): 更新TextFiller类,新增多项配置选项以优化单元格OCR处理,重构识别逻辑以支持详细的行识别和边界框返回,提升OCR的准确性和灵活性。
  • Поређење ових 15 комита »

пре 1 месец

zhengchun извршује push на main у zhengchun/ocr_platform

  • cde2fb8faa fix(更新水印去除调试函数): 修改save_watermark_removal_debug函数以统一调试输出目录结构,更新文档描述和参数,确保与module debug一致,提升调试过程的清晰性和一致性。
  • 8427034b4c feat(优化调试输出目录): 添加resolve_module_debug_dir函数以统一调试输出目录结构,更新相关函数以支持新的目录路径,提升调试过程的灵活性和可维护性。
  • d7e042807c feat(优化调试选项合并): 在PaddleTableClassifier类中更新debug_options合并逻辑,添加default_subdir参数以支持默认子目录配置,提升调试输出路径的灵活性和可维护性。
  • 5a5b23b3a0 feat(优化调试选项合并): 在MinerUWiredTableRecognizer类中更新debug_options合并逻辑,添加default_subdir参数以支持默认子目录配置,提升调试输出路径的灵活性和可维护性。
  • 07852d2774 fix(调整水印去除阈值): 更新水印去除功能中的阈值设置,从160调整为175,并添加注释说明对比度增强的依赖关系,以提升图像处理的准确性和可维护性。
  • Поређење ових 22 комита »

пре 1 месец

zhengchun извршује push на main у zhengchun/ocr_platform

  • 35ee4abec4 feat(更新OCR文档配置): 修改OCR文档配置,更新输入文件、输出目录和配置文件路径,调整处理页面数量以支持新的文档格式。
  • 5f33763ee3 feat(增强OCR框架): 在TextFiller类中添加新的配置参数以处理OCR框的宽度溢出和邻格重叠,优化跨单元格检测逻辑,提升文本填充的准确性。
  • f32733271c feat(优化水印处理): 在图像预处理流程中添加页级水印去除功能,更新相关处理器以支持跳过水印选项,提升表格方向校正的准确性。
  • 3e4d9ab6f0 feat(新增文档配置): 添加三个新的OCR文档配置文件,分别为陈3_微信图、彭_广东兴宁农村商业银行和钟_广东陆丰农村商业银行,定义了使用的OCR工具及其结果目录。
  • 5263c0e66c fix(更新Python环境名称): 将测试文件中的Python环境名称从`mineru2`更新为`mineru`,确保一致性。
  • Поређење ових 8 комита »

пре 1 месец

zhengchun извршује push на main у zhengchun/ocr_platform

пре 2 месеци

zhengchun извршује push на main у zhengchun/ocr_platform

  • eee7efd233 fix(更新示例配置): 修改示例配置文件,更新输入文件、输出目录和日志文件路径
  • ad99559dd2 fix(删除银行交易流水配置): 移除冗余的银行交易流水场景配置文件
  • 00fc409bd4 fix(移除冗余处理器配置): 删除yusys_mineru_local处理器配置,简化配置文件
  • 0456f4d088 fix(更新模型路径): 修改本地GGUF模型路径配置,确保模型正确加载
  • 1cd860a3a0 mineru gguf 无法解析表格
  • Поређење ових 10 комита »

пре 2 месеци

zhengchun извршује push на main у zhengchun/ocr_platform

  • 3bb58ac275 feat(添加严农业银行文档配置): 新增严农业银行的OCR文档配置及相关工具设置
  • 87d30e6dc5 feat(移除VL识别模型参数): 删除不再需要的模型参数配置以简化设置
  • 0d52ee2e18 feat(更新处理器配置): 添加PaddleOCR处理器配置,更新日志目录,新增YUSYS本地处理器支持
  • Поређење ових 3 комита »

пре 2 месеци

zhengchun извршује push на main у zhengchun/ocr_platform

  • 5bb909781f feat(新增水印去除策略): 添加两层独立的水印去除能力,支持PDF层级和图像级水印处理

пре 3 месеци

zhengchun извршује push на main у zhengchun/ocr_platform

  • de041fe413 feat(更新VL识别配置): 将GLM-OCR模块更改为PaddleOCR,更新相关参数以支持更大的图片尺寸和并发处理
  • 2fb3ee41cd feat(添加模型别名支持): 在paddle_local_daemon.sh中添加模型别名配置,并在启动和配置输出中显示
  • d1f002e9a7 feat(更新杨万益_福建农信文档配置): 修改输入输出路径和配置文件,更新日志文件路径
  • Поређење ових 3 комита »

пре 3 месеци

zhengchun извршује push на main у zhengchun/ocr_platform

  • abedc4e5b6 feat(更新PDF分类工具注释): 添加PDF分类工具的注释,说明优先使用MinerU原版及延迟导入策略
  • fadba9a24b fix(修复MinerU组件导入路径): 修改MinerU组件的导入路径以确保正确加载
  • 8032c96d96 feat(新增PDF文档类型分类工具): 添加PDF文档类型分类功能,支持判断可提取文本或需OCR
  • 17d86604f4 feat(更新杨万益_福建农信文档配置): 修改输入输出路径和配置文件,添加日志文件路径
  • a2d8a22d91 feat(新增杨万益_福建农信文档配置): 添加杨万益_福建农信的OCR工具及结果目录配置
  • Поређење ових 15 комита »

пре 3 месеци