zhch158_admin
|
788e93532b
feat: 添加文件路径检查,确保切换数据源时路径有效
|
1 viikko sitten |
zhch158_admin
|
d451e66d4c
feat: 添加 DotsOCR 和 PaddleOCR 合并程序,支持单文件和批量处理,输出为统一的MinerU格式
|
1 viikko sitten |
zhch158_admin
|
6e82eedf30
feat: 添加 DotsOCR 和 PaddleOCR 合并模块,支持 JSON 数据合并和 Markdown 生成
|
1 viikko sitten |
zhch158_admin
|
7018b3372e
feat: 添加 DotsOCR 数据处理功能,支持转换为 MinerU 格式并添加 bbox 信息
|
1 viikko sitten |
zhch158_admin
|
810f8e84a7
feat: 添加 DotsOCR (带 cell bbox) 工具配置,支持结果目录和描述
|
1 viikko sitten |
zhch158_admin
|
18549b7bc5
feat: 添加 2023年度报告母公司.pdf 到 PDF 列表
|
1 viikko sitten |
zhch158_admin
|
1f38e81a65
fix: 修正 DotsOCR 的合并脚本映射,确保正确使用合并脚本
|
1 viikko sitten |
zhch158_admin
|
a59da04cec
feat: 重构数据源选择器,优化文档和OCR工具选择逻辑,支持三列布局
|
1 viikko sitten |
zhch158_admin
|
9dd6fc4a73
feat: 修改主函数,直接从会话状态获取验证器配置
|
1 viikko sitten |
zhch158_admin
|
4a914d9089
feat: 修改 find_available_ocr_files_multi_source 函数,简化数据源唯一标识生成逻辑
|
1 viikko sitten |
zhch158_admin
|
a8b6eabc3a
feat: 优化数据源名称生成逻辑,使用 result_dir 提高唯一性和清晰度
|
1 viikko sitten |
zhch158_admin
|
19be083b28
feat: 修改初始化方法,支持通过配置字典传入配置,移除对 load_config 的依赖
|
1 viikko sitten |
zhch158_admin
|
2643734c43
feat: 初始化配置管理器并优化文档和OCR工具的显示信息
|
1 viikko sitten |
zhch158_admin
|
afc9e3d481
feat: 新增配置管理器,支持分层配置和自动发现数据源,集成 Jinja2 模板变量
|
1 viikko sitten |
zhch158_admin
|
206d52f443
Implement code changes to enhance functionality and improve performance
|
1 viikko sitten |
zhch158_admin
|
776f9654da
feat: 删除合并 MinerU 和 PaddleOCR 的结果的脚本,优化代码结构
|
1 viikko sitten |
zhch158_admin
|
21757ecf65
feat: 添加多个OCR工具配置文件,支持不同文档的OCR结果管理
|
1 viikko sitten |
zhch158_admin
|
a9a8e8cf3b
feat: 添加日志子目录和全局日志配置,优化处理器日志管理
|
1 viikko sitten |
zhch158_admin
|
586f15b189
feat: 添加日志重定向支持,优化PDF批量处理器的日志管理
|
1 viikko sitten |
zhch158_admin
|
9c8d546753
feat: 添加批量合并OCR结果的功能,支持日志重定向和处理器自动检测
|
1 viikko sitten |
zhch158_admin
|
8b7897cee9
feat: 添加PDF批量处理脚本及相关配置文件,支持多种处理器和虚拟环境自动切换
|
2 viikkoa sitten |
zhch158_admin
|
d6caed88c6
feat: 更新数据源配置,添加PaddleOCR VLM及其整合坐标的输出选项
|
4 viikkoa sitten |
zhch158_admin
|
f0d3236884
feat: 修改README文档,将输出格式参数名称从format更改为output-type
|
4 viikkoa sitten |
zhch158_admin
|
7cf744a8dc
feat: 添加UnifiedOutputConverter类,实现不同OCR工具结果转换为MinerU格式
|
4 viikkoa sitten |
zhch158_admin
|
2dca41c351
feat: 更新合并函数,添加data_format参数以支持格式转换为MinerU
|
4 viikkoa sitten |
zhch158_admin
|
184ba0d988
feat: 修改合并函数参数名称,将output_format更改为output_type,统一输出为MinerU格式
|
4 viikkoa sitten |
zhch158_admin
|
4383d618f7
feat: 修改合并函数参数名称,将output_format更改为output_type,统一输出格式参数
|
4 viikkoa sitten |
zhch158_admin
|
84e3ccaf99
feat: 添加MinerU格式化方法,支持页眉、页脚和页码的Markdown生成
|
4 viikkoa sitten |
zhch158_admin
|
d0c46034b0
feat: 添加UnifiedOutputConverter到合并工具包,更新__all__导出列表
|
4 viikkoa sitten |
zhch158_admin
|
baeece7a74
feat: 更新README文档,添加功能说明和使用示例,修正路径引用
|
4 viikkoa sitten |