hankal
|
7d2d878b38
feat(恢复印章识别功能+修复表格文字丢失): 从 main 同步被 sync commit 6472578 误删的功能代码
|
9 hours ago |
hankal
|
6472578a28
sync: 本地 ocr_platform 工作区同步 (hooks/tests/adapters, 精简 lab)
|
1 day ago |
zhch158_admin
|
fde9074e16
feat(新增Conda与uv包管理指南): 新增文档《Conda与uv包管理指南.md》,详细说明OCR Platform及MinerU项目的Python环境管理策略,推荐使用conda进行环境隔离,uv进行依赖安装,提升用户对环境配置的理解与使用指导。
|
4 weeks ago |
zhch158_admin
|
6034a94072
feat(更新本地OCR模型配置): 修改mineru_local_daemon.sh和paddle_local_daemon_1.6.sh中的模型路径,将模型更改为Q8_0版本,提升模型加载的效率与兼容性。
|
1 month ago |
zhch158_admin
|
29af42c4eb
feat(更新本地OCR脚本): 修改curl_local_ocr.sh中的模型和端口配置,将模型更改为glm-ocr,并更新服务端口为8101,提升OCR服务的兼容性与稳定性。
|
1 month ago |
zhch158_admin
|
58a7281a79
feat(更新HF_safetensors到GGUF转换文档): 扩展HF_safetensors->GGUF.md文档,新增对ViT切割机制及投影器映射过程的详细解析,澄清量化对OCR精度的影响,提升用户对模型转换及使用的理解与指导。
|
1 month ago |
zhch158_admin
|
ddcf1e6a31
feat(更新HF_safetensors到GGUF转换文档): 扩展HF_safetensors->GGUF.md文档,详细阐述MinerU2.5-Pro的工作原理、各部件职责及数据流顺序,澄清核心误区,提升用户对文档解析流程的理解与应用指导。
|
1 month ago |
zhch158_admin
|
9413ec2600
feat(更新MinerU本地OCR配置): 修改main_v2.py中的输出目录、配置文件和日志文件路径,以支持新的MinerU处理方式,提升文档解析的灵活性与准确性。
|
1 month ago |
zhch158_admin
|
da4189fde7
feat(新增MinerU本地OCR配置): 在多个配置文件中新增对MinerU的支持,添加相应的工具、结果目录和描述信息,提升OCR框架的灵活性与可用性。
|
1 month ago |
zhch158_admin
|
e4978b5cce
feat(新增JSON序列化支持): 在module_debug_viz.py中新增_json_default函数,增强json.dumps的序列化能力,支持numpy标量/数组、集合和元组的序列化,提升调试信息的可读性与兼容性。
|
1 month ago |
zhch158_admin
|
0cb48eed12
feat(新增银行交易流水场景配置): 新增bank_statement_mineru_vl_local.yaml配置文件,支持银行交易流水和对账单的文档解析,包含输入输出参数、预处理、布局检测、OCR识别及表格分类等功能,提升文档解析的灵活性与准确性。
|
1 month ago |
zhch158_admin
|
b599507513
feat(新增YUSYS本地OCR配置): 在processor_configs.yaml中新增yusys_mineruocr_local配置,支持本地文档解析,包含输入输出参数、额外参数及日志目录设置,提升OCR处理的灵活性与可用性。
|
1 month ago |
zhch158_admin
|
c816ff91ca
feat(新增模型变更巡检工具): 新增model_doctor工具,支持对模型清单进行指纹采集与基线比对,提供模型变更、缺失、服务不可达等状态报告,提升模型管理的可视化与监控能力。同时新增手动维护的模型清单和指纹基线文件,完善文档说明与使用示例。
|
1 month ago |
zhch158_admin
|
3764003f18
feat(删除PaddleOCR-VL 1.6到GGUF转换文档): 删除paddleocr_vl 1.6到GGUF的转换方案文档,清理不再需要的文件,保持文档结构的整洁性。
|
1 month ago |
zhch158_admin
|
327ef352f5
feat(更新本地守护进程脚本): 修改mineru_local_daemon.sh脚本,更新模型路径和文件名,添加llama-server可执行文件路径检查,优化启动和配置提示信息,提升本地服务的可用性与用户体验。
|
1 month ago |
zhch158_admin
|
556b67d19f
feat(新增GGUF转换方案文档): 新增HF_safetensors->GGUF.md文档,详细说明PaddleOCR-VL 1.6到GGUF的转换步骤与注意事项,提供两条高效路径,解决OTSL结构token过滤问题,提升用户在模型转换过程中的指导性与可操作性。
|
1 month ago |
zhch158_admin
|
4af3067a19
feat(更新PaddleOCR配置): 修改main_v2.py中的PaddleOCR配置,调整输出目录、配置文件和日志文件路径,以支持新的处理方式,提升文档解析的灵活性与准确性。
|
1 month ago |
zhch158_admin
|
213a1ca9f2
feat(新增PaddleOCR本地配置): 在多个配置文件中新增对PaddleOCR的支持,添加相应的工具、结果目录和描述信息,提升OCR框架的灵活性与可用性。
|
1 month ago |
zhch158_admin
|
4e44a6c829
feat(新增mineru_vl_utils运行时补丁): 新增对PaddleOCR-VL的OTSL转换补丁,修复表格首格缺失前导结构token的问题,确保输出HTML中完整保留文本,提升文档解析的准确性与可靠性。同时在MinerUVLRecognizer初始化中应用该补丁,确保兼容性。
|
1 month ago |
zhch158_admin
|
beb41fe75e
feat(新增印章补充检测功能): 在bank_statement_paddle_vl_local.yaml中新增印章补充检测配置,优化密封区域识别能力,提升文档解析的准确性与完整性。同时更新表格识别配置,调整PaddleOCR-VL模型版本至1.6,增强整体OCR性能。
|
1 month ago |
zhch158_admin
|
9e171404ce
feat(新增PaddleOCR-VL表格文字丢失问题补丁): 新增运行时补丁模块,修复PaddleOCR-VL在OTSL转换过程中表格首格文字丢失的问题,确保输出HTML中保留完整文本,提升文档解析的准确性与可靠性。
|
1 month ago |
zhch158_admin
|
2257f5093d
feat(新增PaddleOCR-VL 1.6到GGUF转换文档): 新增paddleocr_vl 1.6到GGUF的详细转换方案,提供两条高效路径,包含社区资源和自转步骤,提升用户在模型转换过程中的指导性与可操作性。
|
1 month ago |
zhch158_admin
|
497c6aa2de
feat(新增PaddleOCR-VL本地服务脚本): 新增paddle_local_daemon_1.6.sh脚本,支持在macOS上启动PaddleOCR-VL本地llama-server服务,配置模型路径、参数及日志管理,提升本地OCR服务的可用性与易用性。
|
1 month ago |
zhch158_admin
|
396ee1e6ec
feat(优化OCR框颜色管理): 更新ocr_validator_layout.py,调整OCR框颜色获取方式,改为使用VisualizationUtils中的颜色映射,新增印章类别支持,提升布局结构框的可视化效果与一致性。
|
1 month ago |
zhch158_admin
|
0d0e8d028a
feat(优化OCR框颜色管理): 在module_debug_viz.py中新增OCR框和印章框颜色获取函数,更新draw_ocr_spans_cv2函数以支持按类别动态着色,提升可视化效果;在output_formatter_v2.py中调整OCR框和单元格框颜色引用,确保一致性;在visualization_utils.py中完善颜色定义,增强模块间的可维护性。
|
1 month ago |
zhch158_admin
|
611a94104f
feat(新增可视化颜色系统文档): 在README_COLOR_SYSTEM.md中新增可视化颜色系统设计文档,详细说明颜色定义、转换工具及模块间引用关系,提升项目可维护性与开发者理解。
|
1 month ago |
zhch158_admin
|
8bf66bc119
feat(增强印章OCR处理): 在ocr_validator_utils.py中新增对印章类别的支持,优化文本解析逻辑,添加印章相关信息的提取与处理,提升印章识别能力与数据解析的准确性。
|
1 month ago |
zhch158_admin
|
87b0f0a6e8
feat(增强OCR布局管理): 在ocr_validator_layout.py中新增类别颜色转换函数,优化边界框收集逻辑,支持按类别着色,提升可视化效果与用户体验。
|
1 month ago |
zhch158_admin
|
80d0437081
feat(更新可视化工具): 在visualization_utils.py中新增图表和印章的颜色定义,调整OCR框和单元格框的颜色为亮蓝,以提升可视化效果的一致性。
|
1 month ago |
zhch158_admin
|
bcea502090
feat(增强布局绘制功能): 在module_debug_viz.py中新增印章和图表的颜色定义,优化绘制逻辑,添加OCR框收集功能,提升文档元素的可视化效果与识别能力。
|
1 month ago |