提交历史

作者 SHA1 备注 提交日期
  zhch158_admin 35ee4abec4 feat(更新OCR文档配置): 修改OCR文档配置,更新输入文件、输出目录和配置文件路径,调整处理页面数量以支持新的文档格式。 2 天之前
  zhch158_admin 5f33763ee3 feat(增强OCR框架): 在TextFiller类中添加新的配置参数以处理OCR框的宽度溢出和邻格重叠,优化跨单元格检测逻辑,提升文本填充的准确性。 2 天之前
  zhch158_admin f32733271c feat(优化水印处理): 在图像预处理流程中添加页级水印去除功能,更新相关处理器以支持跳过水印选项,提升表格方向校正的准确性。 2 天之前
  zhch158_admin 3e4d9ab6f0 feat(新增文档配置): 添加三个新的OCR文档配置文件,分别为陈3_微信图、彭_广东兴宁农村商业银行和钟_广东陆丰农村商业银行,定义了使用的OCR工具及其结果目录。 2 天之前
  zhch158_admin 5263c0e66c fix(更新Python环境名称): 将测试文件中的Python环境名称从`mineru2`更新为`mineru`,确保一致性。 2 天之前
  zhch158_admin 64ad4a204d fix(修复倾斜角度检测): 修改SkewDetector类中的cv2.fitLine返回值处理,确保返回值显式转为标量,并更新异常处理为错误日志记录。 2 天之前
  zhch158_admin fb3ea48bb4 feat(新增银行交易流水场景配置): 添加银行交易流水V4场景配置,整合多种OCR识别功能及布局检测,支持有线和无线表格处理。 2 天之前
  zhch158_admin 6518b09bbd fix(更新环境名称): 将所有配置和文档中的`mineru2`环境名称更新为`mineru`,确保一致性和准确性。 2 天之前
  zhch158_admin 1262c510b7 fix(调整内容顺序): 调整payload.json中的内容顺序,确保图像URL在文本之前 3 周之前
  zhch158_admin 6a4c6d2098 fix(调整内容顺序): 修改curl_local_mineru.sh和curl_local_ocr.sh中的内容顺序,确保图像URL在文本之前 3 周之前
  zhch158_admin eee7efd233 fix(更新示例配置): 修改示例配置文件,更新输入文件、输出目录和日志文件路径 3 周之前
  zhch158_admin ad99559dd2 fix(删除银行交易流水配置): 移除冗余的银行交易流水场景配置文件 3 周之前
  zhch158_admin 00fc409bd4 fix(移除冗余处理器配置): 删除yusys_mineru_local处理器配置,简化配置文件 3 周之前
  zhch158_admin 0456f4d088 fix(更新模型路径): 修改本地GGUF模型路径配置,确保模型正确加载 3 周之前
  zhch158_admin 1cd860a3a0 mineru gguf 无法解析表格 3 周之前
  zhch158_admin d580a3564e fix(更新VL识别配置): 修改VL识别配置注释,使用PaddleOcr-VL替代GLM-OCR 3 周之前
  zhch158_admin c91cbc3423 feat(新增银行交易流水场景配置): 添加MinerU VL本地版配置文件,支持多种输入格式及OCR识别功能 3 周之前
  zhch158_admin 5dc0ce9298 feat(新增MinerU2.5-Pro本地守护进程): 添加MinerU2.5-Pro llama-server服务脚本,支持模型加载和管理 3 周之前
  zhch158_admin 7ce1273f1d feat(更新模型路径): 修改本地GGUF模型路径配置,使用新的HF_CACHE路径以确保模型正确加载 3 周之前
  zhch158_admin 226a59b4b6 feat(新增YUSYS MinerU本地处理器配置): 添加YUSYS(local) Wired UNET OCR MinerU-VL处理器配置及相关参数 3 周之前
  zhch158_admin 3bb58ac275 feat(添加严农业银行文档配置): 新增严农业银行的OCR文档配置及相关工具设置 3 周之前
  zhch158_admin 87d30e6dc5 feat(移除VL识别模型参数): 删除不再需要的模型参数配置以简化设置 3 周之前
  zhch158_admin 0d52ee2e18 feat(更新处理器配置): 添加PaddleOCR处理器配置,更新日志目录,新增YUSYS本地处理器支持 3 周之前
  zhch158_admin 5bb909781f feat(新增水印去除策略): 添加两层独立的水印去除能力,支持PDF层级和图像级水印处理 1 月之前
  zhch158_admin de041fe413 feat(更新VL识别配置): 将GLM-OCR模块更改为PaddleOCR,更新相关参数以支持更大的图片尺寸和并发处理 1 月之前
  zhch158_admin 2fb3ee41cd feat(添加模型别名支持): 在paddle_local_daemon.sh中添加模型别名配置,并在启动和配置输出中显示 1 月之前
  zhch158_admin d1f002e9a7 feat(更新杨万益_福建农信文档配置): 修改输入输出路径和配置文件,更新日志文件路径 1 月之前
  zhch158_admin abedc4e5b6 feat(更新PDF分类工具注释): 添加PDF分类工具的注释,说明优先使用MinerU原版及延迟导入策略 1 月之前
  zhch158_admin fadba9a24b fix(修复MinerU组件导入路径): 修改MinerU组件的导入路径以确保正确加载 1 月之前
  zhch158_admin 8032c96d96 feat(新增PDF文档类型分类工具): 添加PDF文档类型分类功能,支持判断可提取文本或需OCR 1 月之前