Commit History

Author SHA1 Message Date
  zhch158_admin d1b21341f2 feat: 添加OCR验证系统配置文件说明文档 1 week ago
  zhch158_admin ad61e0ace2 fix: 修正OCR工具统计信息的显示文本 1 week ago
  zhch158_admin 672d58aaf3 feat: 改进表头检测逻辑,新增分类行判断,优化得分计算 1 week ago
  zhch158_admin 6414c446cf Update file paths for OCR results comparison in compare_ocr_results.py 1 week ago
  zhch158_admin 979d73759e feat: 调整长度比例检查逻辑,修改阈值以提高匹配准确性 1 week ago
  zhch158_admin b98a9c626f feat: 修改表格行检测逻辑,支持小于10行的表格进行全面检测 1 week ago
  zhch158_admin e9e17431e8 feat: 注释掉过短候选文本的过滤逻辑,避免单字符匹配 1 week ago
  zhch158_admin d813017609 feat: 更新默认配置文件路径,指向新的 PaddleOCR_VL 和 PaddleOCR 文件 1 week ago
  zhch158_admin 038666f9ed feat: 优化 PaddleOCR_VL 数据处理逻辑,移除不必要的格式转换 1 week ago
  zhch158_admin 6e15bf3df4 feat: 更新默认配置文件路径,指向新的数据集位置 1 week ago
  zhch158_admin 7930c6cd71 feat: 添加对 PaddleOCR_VL 数据的旋转角度和原始图像尺寸处理,优化 bbox 坐标转换 1 week ago
  zhch158_admin 2ec53f5194 feat: 添加旋转角度处理和原始图像尺寸获取功能,支持坐标反向旋转 1 week ago
  zhch158_admin 788e93532b feat: 添加文件路径检查,确保切换数据源时路径有效 1 week ago
  zhch158_admin d451e66d4c feat: 添加 DotsOCR 和 PaddleOCR 合并程序,支持单文件和批量处理,输出为统一的MinerU格式 1 week ago
  zhch158_admin 6e82eedf30 feat: 添加 DotsOCR 和 PaddleOCR 合并模块,支持 JSON 数据合并和 Markdown 生成 1 week ago
  zhch158_admin 7018b3372e feat: 添加 DotsOCR 数据处理功能,支持转换为 MinerU 格式并添加 bbox 信息 1 week ago
  zhch158_admin 810f8e84a7 feat: 添加 DotsOCR (带 cell bbox) 工具配置,支持结果目录和描述 1 week ago
  zhch158_admin 18549b7bc5 feat: 添加 2023年度报告母公司.pdf 到 PDF 列表 1 week ago
  zhch158_admin 1f38e81a65 fix: 修正 DotsOCR 的合并脚本映射,确保正确使用合并脚本 1 week ago
  zhch158_admin a59da04cec feat: 重构数据源选择器,优化文档和OCR工具选择逻辑,支持三列布局 1 week ago
  zhch158_admin 9dd6fc4a73 feat: 修改主函数,直接从会话状态获取验证器配置 1 week ago
  zhch158_admin 4a914d9089 feat: 修改 find_available_ocr_files_multi_source 函数,简化数据源唯一标识生成逻辑 1 week ago
  zhch158_admin a8b6eabc3a feat: 优化数据源名称生成逻辑,使用 result_dir 提高唯一性和清晰度 1 week ago
  zhch158_admin 19be083b28 feat: 修改初始化方法,支持通过配置字典传入配置,移除对 load_config 的依赖 1 week ago
  zhch158_admin 2643734c43 feat: 初始化配置管理器并优化文档和OCR工具的显示信息 1 week ago
  zhch158_admin afc9e3d481 feat: 新增配置管理器,支持分层配置和自动发现数据源,集成 Jinja2 模板变量 1 week ago
  zhch158_admin 206d52f443 Implement code changes to enhance functionality and improve performance 1 week ago
  zhch158_admin 776f9654da feat: 删除合并 MinerU 和 PaddleOCR 的结果的脚本,优化代码结构 1 week ago
  zhch158_admin 21757ecf65 feat: 添加多个OCR工具配置文件,支持不同文档的OCR结果管理 1 week ago
  zhch158_admin a9a8e8cf3b feat: 添加日志子目录和全局日志配置,优化处理器日志管理 1 week ago