커밋 기록

작성자 SHA1 메시지 날짜
  zhch158_admin a59da04cec feat: 重构数据源选择器,优化文档和OCR工具选择逻辑,支持三列布局 1 주 전
  zhch158_admin 9dd6fc4a73 feat: 修改主函数,直接从会话状态获取验证器配置 1 주 전
  zhch158_admin 4a914d9089 feat: 修改 find_available_ocr_files_multi_source 函数,简化数据源唯一标识生成逻辑 1 주 전
  zhch158_admin a8b6eabc3a feat: 优化数据源名称生成逻辑,使用 result_dir 提高唯一性和清晰度 1 주 전
  zhch158_admin 19be083b28 feat: 修改初始化方法,支持通过配置字典传入配置,移除对 load_config 的依赖 1 주 전
  zhch158_admin 2643734c43 feat: 初始化配置管理器并优化文档和OCR工具的显示信息 1 주 전
  zhch158_admin afc9e3d481 feat: 新增配置管理器,支持分层配置和自动发现数据源,集成 Jinja2 模板变量 1 주 전
  zhch158_admin 206d52f443 Implement code changes to enhance functionality and improve performance 1 주 전
  zhch158_admin 776f9654da feat: 删除合并 MinerU 和 PaddleOCR 的结果的脚本,优化代码结构 1 주 전
  zhch158_admin 21757ecf65 feat: 添加多个OCR工具配置文件,支持不同文档的OCR结果管理 1 주 전
  zhch158_admin a9a8e8cf3b feat: 添加日志子目录和全局日志配置,优化处理器日志管理 1 주 전
  zhch158_admin 586f15b189 feat: 添加日志重定向支持,优化PDF批量处理器的日志管理 1 주 전
  zhch158_admin 9c8d546753 feat: 添加批量合并OCR结果的功能,支持日志重定向和处理器自动检测 1 주 전
  zhch158_admin 8b7897cee9 feat: 添加PDF批量处理脚本及相关配置文件,支持多种处理器和虚拟环境自动切换 2 주 전
  zhch158_admin d6caed88c6 feat: 更新数据源配置,添加PaddleOCR VLM及其整合坐标的输出选项 3 주 전
  zhch158_admin f0d3236884 feat: 修改README文档,将输出格式参数名称从format更改为output-type 3 주 전
  zhch158_admin 7cf744a8dc feat: 添加UnifiedOutputConverter类,实现不同OCR工具结果转换为MinerU格式 3 주 전
  zhch158_admin 2dca41c351 feat: 更新合并函数,添加data_format参数以支持格式转换为MinerU 3 주 전
  zhch158_admin 184ba0d988 feat: 修改合并函数参数名称,将output_format更改为output_type,统一输出为MinerU格式 3 주 전
  zhch158_admin 4383d618f7 feat: 修改合并函数参数名称,将output_format更改为output_type,统一输出格式参数 3 주 전
  zhch158_admin 84e3ccaf99 feat: 添加MinerU格式化方法,支持页眉、页脚和页码的Markdown生成 3 주 전
  zhch158_admin d0c46034b0 feat: 添加UnifiedOutputConverter到合并工具包,更新__all__导出列表 3 주 전
  zhch158_admin baeece7a74 feat: 更新README文档,添加功能说明和使用示例,修正路径引用 4 주 전
  zhch158_admin 6032305e68 feat: 添加OCR结果合并工具说明文档,详细描述合并方式、目录结构及核心模块 4 주 전
  zhch158_admin 5e508282f0 feat: 添加PaddleOCR_VL和PaddleOCR结果合并模块,支持数据加载和Markdown生成 4 주 전
  zhch158_admin d161a5c493 feat: 更新生成Markdown的方法,改为使用私有方法_generate_mineru_markdown 4 주 전
  zhch158_admin b05805849a feat: 添加PaddleOCR_VL与PaddleOCR结果合并功能,支持单文件和批量处理 4 주 전
  zhch158_admin 069753e209 feat: 增强Markdown生成器,支持自动检测数据格式并生成PaddleOCR_VL格式的Markdown 4 주 전
  zhch158_admin 68cc1bcae8 feat: 更新文档注释,添加对PaddleOCR_VL的支持 4 주 전
  zhch158_admin ce302a0003 feat: 添加对PaddleOCR_VL数据的处理逻辑,增强数据合并功能 4 주 전