提交歷史

作者 SHA1 備註 提交日期
  zhch158_admin 57178ab8f2 feat(优化水印去除和方向校正): 增强remove_watermark方法以支持可选对比度增强,改进correct_orientation方法以处理PDF旋转和方向分类器,优化process方法以支持裁剪块处理,提升OCR图像预处理的灵活性和准确性。 5 天之前
  zhch158_admin 1c67a0d785 feat(增强图像预处理): 在BasePreprocessor类中添加水印调试选项和图像处理顺序配置,优化方向校正和水印去除流程,提升OCR处理的灵活性和准确性。 5 天之前
  zhch158_admin 92b9d902ee feat(增强布局路由器和文档管道): 在SmartLayoutRouter中添加布局调试上下文传播功能,优化模型检测流程;在EnhancedDocPipeline中改进页面预处理,注入水印调试上下文,增强OCR调试选项,提升处理灵活性和准确性。 5 天之前
  zhch158_admin ad60ed5eca feat(更新银行流水配置): 修改bank_statement_glm_vl_local.yaml以禁用水印去除功能,更新bank_statement_yusys_local.yaml以增强水印处理配置,添加新参数和调试选项,提升处理灵活性和准确性。 5 天之前
  zhch158_admin 5bbe299ec9 feat(优化水印去除工具): 更新remove_watermark.py,增强命令行参数支持,添加调试图保存功能,整合水印处理配置,提升处理灵活性和准确性。 5 天之前
  zhch158_admin 35ee4abec4 feat(更新OCR文档配置): 修改OCR文档配置,更新输入文件、输出目录和配置文件路径,调整处理页面数量以支持新的文档格式。 1 周之前
  zhch158_admin 5f33763ee3 feat(增强OCR框架): 在TextFiller类中添加新的配置参数以处理OCR框的宽度溢出和邻格重叠,优化跨单元格检测逻辑,提升文本填充的准确性。 1 周之前
  zhch158_admin f32733271c feat(优化水印处理): 在图像预处理流程中添加页级水印去除功能,更新相关处理器以支持跳过水印选项,提升表格方向校正的准确性。 1 周之前
  zhch158_admin 3e4d9ab6f0 feat(新增文档配置): 添加三个新的OCR文档配置文件,分别为陈3_微信图、彭_广东兴宁农村商业银行和钟_广东陆丰农村商业银行,定义了使用的OCR工具及其结果目录。 1 周之前
  zhch158_admin 5263c0e66c fix(更新Python环境名称): 将测试文件中的Python环境名称从`mineru2`更新为`mineru`,确保一致性。 1 周之前
  zhch158_admin 64ad4a204d fix(修复倾斜角度检测): 修改SkewDetector类中的cv2.fitLine返回值处理,确保返回值显式转为标量,并更新异常处理为错误日志记录。 1 周之前
  zhch158_admin fb3ea48bb4 feat(新增银行交易流水场景配置): 添加银行交易流水V4场景配置,整合多种OCR识别功能及布局检测,支持有线和无线表格处理。 1 周之前
  zhch158_admin 6518b09bbd fix(更新环境名称): 将所有配置和文档中的`mineru2`环境名称更新为`mineru`,确保一致性和准确性。 1 周之前
  zhch158_admin 1262c510b7 fix(调整内容顺序): 调整payload.json中的内容顺序,确保图像URL在文本之前 1 月之前
  zhch158_admin 6a4c6d2098 fix(调整内容顺序): 修改curl_local_mineru.sh和curl_local_ocr.sh中的内容顺序,确保图像URL在文本之前 1 月之前
  zhch158_admin eee7efd233 fix(更新示例配置): 修改示例配置文件,更新输入文件、输出目录和日志文件路径 1 月之前
  zhch158_admin ad99559dd2 fix(删除银行交易流水配置): 移除冗余的银行交易流水场景配置文件 1 月之前
  zhch158_admin 00fc409bd4 fix(移除冗余处理器配置): 删除yusys_mineru_local处理器配置,简化配置文件 1 月之前
  zhch158_admin 0456f4d088 fix(更新模型路径): 修改本地GGUF模型路径配置,确保模型正确加载 1 月之前
  zhch158_admin 1cd860a3a0 mineru gguf 无法解析表格 1 月之前
  zhch158_admin d580a3564e fix(更新VL识别配置): 修改VL识别配置注释,使用PaddleOcr-VL替代GLM-OCR 1 月之前
  zhch158_admin c91cbc3423 feat(新增银行交易流水场景配置): 添加MinerU VL本地版配置文件,支持多种输入格式及OCR识别功能 1 月之前
  zhch158_admin 5dc0ce9298 feat(新增MinerU2.5-Pro本地守护进程): 添加MinerU2.5-Pro llama-server服务脚本,支持模型加载和管理 1 月之前
  zhch158_admin 7ce1273f1d feat(更新模型路径): 修改本地GGUF模型路径配置,使用新的HF_CACHE路径以确保模型正确加载 1 月之前
  zhch158_admin 226a59b4b6 feat(新增YUSYS MinerU本地处理器配置): 添加YUSYS(local) Wired UNET OCR MinerU-VL处理器配置及相关参数 1 月之前
  zhch158_admin 3bb58ac275 feat(添加严农业银行文档配置): 新增严农业银行的OCR文档配置及相关工具设置 1 月之前
  zhch158_admin 87d30e6dc5 feat(移除VL识别模型参数): 删除不再需要的模型参数配置以简化设置 1 月之前
  zhch158_admin 0d52ee2e18 feat(更新处理器配置): 添加PaddleOCR处理器配置,更新日志目录,新增YUSYS本地处理器支持 1 月之前
  zhch158_admin 5bb909781f feat(新增水印去除策略): 添加两层独立的水印去除能力,支持PDF层级和图像级水印处理 1 月之前
  zhch158_admin de041fe413 feat(更新VL识别配置): 将GLM-OCR模块更改为PaddleOCR,更新相关参数以支持更大的图片尺寸和并发处理 1 月之前