コミット履歴

作者 SHA1 メッセージ 日付
  zhch158_admin 4af3067a19 feat(更新PaddleOCR配置): 修改main_v2.py中的PaddleOCR配置,调整输出目录、配置文件和日志文件路径,以支持新的处理方式,提升文档解析的灵活性与准确性。 1 ヶ月 前
  zhch158_admin 213a1ca9f2 feat(新增PaddleOCR本地配置): 在多个配置文件中新增对PaddleOCR的支持,添加相应的工具、结果目录和描述信息,提升OCR框架的灵活性与可用性。 1 ヶ月 前
  zhch158_admin 4e44a6c829 feat(新增mineru_vl_utils运行时补丁): 新增对PaddleOCR-VL的OTSL转换补丁,修复表格首格缺失前导结构token的问题,确保输出HTML中完整保留文本,提升文档解析的准确性与可靠性。同时在MinerUVLRecognizer初始化中应用该补丁,确保兼容性。 1 ヶ月 前
  zhch158_admin beb41fe75e feat(新增印章补充检测功能): 在bank_statement_paddle_vl_local.yaml中新增印章补充检测配置,优化密封区域识别能力,提升文档解析的准确性与完整性。同时更新表格识别配置,调整PaddleOCR-VL模型版本至1.6,增强整体OCR性能。 1 ヶ月 前
  zhch158_admin 9e171404ce feat(新增PaddleOCR-VL表格文字丢失问题补丁): 新增运行时补丁模块,修复PaddleOCR-VL在OTSL转换过程中表格首格文字丢失的问题,确保输出HTML中保留完整文本,提升文档解析的准确性与可靠性。 1 ヶ月 前
  zhch158_admin 2257f5093d feat(新增PaddleOCR-VL 1.6到GGUF转换文档): 新增paddleocr_vl 1.6到GGUF的详细转换方案,提供两条高效路径,包含社区资源和自转步骤,提升用户在模型转换过程中的指导性与可操作性。 1 ヶ月 前
  zhch158_admin 497c6aa2de feat(新增PaddleOCR-VL本地服务脚本): 新增paddle_local_daemon_1.6.sh脚本,支持在macOS上启动PaddleOCR-VL本地llama-server服务,配置模型路径、参数及日志管理,提升本地OCR服务的可用性与易用性。 1 ヶ月 前
  zhch158_admin 396ee1e6ec feat(优化OCR框颜色管理): 更新ocr_validator_layout.py,调整OCR框颜色获取方式,改为使用VisualizationUtils中的颜色映射,新增印章类别支持,提升布局结构框的可视化效果与一致性。 1 ヶ月 前
  zhch158_admin 0d0e8d028a feat(优化OCR框颜色管理): 在module_debug_viz.py中新增OCR框和印章框颜色获取函数,更新draw_ocr_spans_cv2函数以支持按类别动态着色,提升可视化效果;在output_formatter_v2.py中调整OCR框和单元格框颜色引用,确保一致性;在visualization_utils.py中完善颜色定义,增强模块间的可维护性。 1 ヶ月 前
  zhch158_admin 611a94104f feat(新增可视化颜色系统文档): 在README_COLOR_SYSTEM.md中新增可视化颜色系统设计文档,详细说明颜色定义、转换工具及模块间引用关系,提升项目可维护性与开发者理解。 1 ヶ月 前
  zhch158_admin 8bf66bc119 feat(增强印章OCR处理): 在ocr_validator_utils.py中新增对印章类别的支持,优化文本解析逻辑,添加印章相关信息的提取与处理,提升印章识别能力与数据解析的准确性。 1 ヶ月 前
  zhch158_admin 87b0f0a6e8 feat(增强OCR布局管理): 在ocr_validator_layout.py中新增类别颜色转换函数,优化边界框收集逻辑,支持按类别着色,提升可视化效果与用户体验。 1 ヶ月 前
  zhch158_admin 80d0437081 feat(更新可视化工具): 在visualization_utils.py中新增图表和印章的颜色定义,调整OCR框和单元格框的颜色为亮蓝,以提升可视化效果的一致性。 1 ヶ月 前
  zhch158_admin bcea502090 feat(增强布局绘制功能): 在module_debug_viz.py中新增印章和图表的颜色定义,优化绘制逻辑,添加OCR框收集功能,提升文档元素的可视化效果与识别能力。 1 ヶ月 前
  zhch158_admin cb83d24f8c feat(更新布局检测器与新增印章OCR适配器): 修改PaddleLayoutDetector和PPDocLayoutV3Detector类的类别映射,优化印章和图表的处理逻辑,同时新增SealOCRRecognizer适配器以支持印章OCR识别,提升文档解析与印章识别能力。 1 ヶ月 前
  zhch158_admin b3d375584d feat(更新布局检测器类别): 在MinerUVLLayoutDetector类中添加对印章和图表类别的支持,优化文档解析能力。 1 ヶ月 前
  zhch158_admin 49a0fefc0e feat(新增SealOCR识别器支持): 在适配器模块中引入SealOCRRecognizer,并更新BaseLayoutDetector类以处理印章类别的重叠情况,优化印章识别流程。 1 ヶ月 前
  zhch158_admin 797bad05df feat(增强文档处理管道): 在EnhancedDocPipeline类中添加印章OCR识别器的初始化与清理逻辑,更新图片相关元素类别以支持图表,优化印章元素处理流程,提升印章识别的准确性与灵活性。 1 ヶ月 前
  zhch158_admin d1e3ac399d feat(新增印章OCR识别器创建方法): 在ModelFactory类中添加create_seal_ocr_recognizer方法,用于创建并初始化SealOCRRecognizer,提升印章OCR识别能力。 1 ヶ月 前
  zhch158_admin 6e1b1bead4 feat(新增印章补充检测器): 在SmartLayoutRouter类中添加seal补充检测功能,初始化PP-DocLayoutV3模型以提升印章区域的识别能力,并实现结果合并与调试信息保存,优化印章检测流程。 1 ヶ月 前
  zhch158_admin 31ae5b84ca feat(新增印章OCR识别器): 在ElementProcessors类中添加seal_ocr_recognizer参数,优化印章处理逻辑,优先使用SealOCRRecognizer进行识别,回退至VLM,提升印章识别的准确性与灵活性。 1 ヶ月 前
  zhch158_admin e72a51154f feat(新增印章补充检测功能): 在多个YAML配置文件中添加印章补充检测配置,启用PP-DocLayoutV3模型以提升对密封区域的识别能力,同时更新银行流水描述以反映新功能。 1 ヶ月 前
  zhch158_admin 48ff3fcd63 feat(新增印章识别处理流程文档): 添加MinerU印章识别处理流程的详细文档,涵盖布局检测、印章文字OCR及相关模型配置,提升用户对印章识别功能的理解与使用指导。 1 ヶ月 前
  zhch158_admin 4cd6801a2f fix(优化单元格OCR处理逻辑): 更新有线表格识别文档,详细说明二次OCR的核心设计与实现,增加对水印过滤、纵向完整性检测及列空判断的描述,提升OCR处理的准确性与灵活性。 1 ヶ月 前
  zhch158_admin e7d756752c fix(更新OCR示例路径): 修改main_v2.py中的OCR示例输入输出路径,更新为新的文件名和目录,以便于后续测试和使用。 1 ヶ月 前
  zhch158_admin ac90e7c976 fix(优化文本填充逻辑): 更新TextFiller类中的文本填充逻辑,增加对OCR结果不完整的判断,优化返回的原因列表,提升OCR处理的准确性与灵活性。 1 ヶ月 前
  zhch158_admin d817ad414b fix(优化二次OCR参数配置): 更新多个YAML配置文件中的二次OCR参数,调整水印去除、对比度增强及放大处理设置,以提升银行流水场景下的OCR处理准确性与灵活性。 1 ヶ月 前
  zhch158_admin fd4a208147 fix(更新OCR参数示例): 修改main_v2.py中的OCR参数示例,调整页面处理范围为1页,并注释掉特定输入输出路径配置,以便于后续使用和测试。 1 ヶ月 前
  zhch158_admin a8ca9d4dc3 fix(优化二次OCR逻辑与参数): 更新二次OCR处理逻辑,增加对空单元格的判断,优化匹配框的使用,提升银行流水模式下的OCR准确性。同时调整相关测试用例以验证新逻辑的有效性。 1 ヶ月 前
  zhch158_admin db56c3775a fix(优化二次OCR参数配置): 更新bank_statement_yusys_local.yaml中的二次OCR参数,调整upscale_min_side的值以优化常规与低分场景下的OCR处理,提升整体识别准确性与灵活性。 1 ヶ月 前