zhch158_admin
|
8b7897cee9
feat: 添加PDF批量处理脚本及相关配置文件,支持多种处理器和虚拟环境自动切换
|
2 weeks ago |
zhch158_admin
|
d6caed88c6
feat: 更新数据源配置,添加PaddleOCR VLM及其整合坐标的输出选项
|
4 weeks ago |
zhch158_admin
|
f0d3236884
feat: 修改README文档,将输出格式参数名称从format更改为output-type
|
4 weeks ago |
zhch158_admin
|
7cf744a8dc
feat: 添加UnifiedOutputConverter类,实现不同OCR工具结果转换为MinerU格式
|
4 weeks ago |
zhch158_admin
|
2dca41c351
feat: 更新合并函数,添加data_format参数以支持格式转换为MinerU
|
4 weeks ago |
zhch158_admin
|
184ba0d988
feat: 修改合并函数参数名称,将output_format更改为output_type,统一输出为MinerU格式
|
4 weeks ago |
zhch158_admin
|
4383d618f7
feat: 修改合并函数参数名称,将output_format更改为output_type,统一输出格式参数
|
4 weeks ago |
zhch158_admin
|
84e3ccaf99
feat: 添加MinerU格式化方法,支持页眉、页脚和页码的Markdown生成
|
4 weeks ago |
zhch158_admin
|
d0c46034b0
feat: 添加UnifiedOutputConverter到合并工具包,更新__all__导出列表
|
4 weeks ago |
zhch158_admin
|
baeece7a74
feat: 更新README文档,添加功能说明和使用示例,修正路径引用
|
4 weeks ago |
zhch158_admin
|
6032305e68
feat: 添加OCR结果合并工具说明文档,详细描述合并方式、目录结构及核心模块
|
4 weeks ago |
zhch158_admin
|
5e508282f0
feat: 添加PaddleOCR_VL和PaddleOCR结果合并模块,支持数据加载和Markdown生成
|
4 weeks ago |
zhch158_admin
|
d161a5c493
feat: 更新生成Markdown的方法,改为使用私有方法_generate_mineru_markdown
|
4 weeks ago |
zhch158_admin
|
b05805849a
feat: 添加PaddleOCR_VL与PaddleOCR结果合并功能,支持单文件和批量处理
|
4 weeks ago |
zhch158_admin
|
069753e209
feat: 增强Markdown生成器,支持自动检测数据格式并生成PaddleOCR_VL格式的Markdown
|
4 weeks ago |
zhch158_admin
|
68cc1bcae8
feat: 更新文档注释,添加对PaddleOCR_VL的支持
|
4 weeks ago |
zhch158_admin
|
ce302a0003
feat: 添加对PaddleOCR_VL数据的处理逻辑,增强数据合并功能
|
4 weeks ago |
zhch158_admin
|
9605070c6b
feat: 增强OCR结果比较器,优化段落对齐和结构化内容提取逻辑
|
4 weeks ago |
zhch158_admin
|
be7c23a036
feat: 重构内容提取逻辑,增强文本标准化和段落提取功能
|
4 weeks ago |
zhch158_admin
|
a38fc65f9f
feat: 更新测试文件路径以匹配新的数据文件
|
4 weeks ago |
zhch158_admin
|
46e6182a8e
feat: 更新测试文件路径,调整对比结果输出位置
|
4 weeks ago |
zhch158_admin
|
9ee101cda4
feat: 添加差异严重度标记,增强比较结果的可读性
|
4 weeks ago |
zhch158_admin
|
0ecea1078f
feat: 优化文本匹配逻辑,增强相似度计算和匹配准确性
|
4 weeks ago |
zhch158_admin
|
f3ddfa08ae
feat: 完善单元格信息记录和匹配失败处理逻辑
|
4 weeks ago |
zhch158_admin
|
91a2dd3b39
feat: 删除合并 MinerU 和 PaddleOCR 结果的功能代码
|
4 weeks ago |
zhch158_admin
|
f137faec73
feat: Add MinerU and PaddleOCR result merging functionality
|
4 weeks ago |
zhch158_admin
|
da77089e7b
feat: 更新测试用例,调整流水表格对比的文件路径
|
4 weeks ago |
zhch158_admin
|
e02c0f2d22
feat: 新增智能表格匹配功能,优化表格相似度计算和表头检测
|
4 weeks ago |
zhch158_admin
|
e9b1502957
feat: 增强表格比较功能,支持智能匹配与未匹配表格的详细报告
|
4 weeks ago |
zhch158_admin
|
f77b44c369
feat: 新增多个OCR数据源配置,支持德_内蒙古银行照和对公_招商银行图的多种OCR工具
|
4 weeks ago |