zhch158_admin
|
b2ff96cc83
fix: 修复图表宽度设置,使用容器宽度替代废弃参数
|
hai 4 días |
zhch158_admin
|
cc3e15d2d7
feat: 更新OCR结果比较功能,添加日期时间格式检测和解析逻辑
|
hai 1 semana |
zhch158_admin
|
88905951a0
feat: 添加康强_北京农村商业银行的OCR配置文件及数据源
|
hai 1 semana |
zhch158_admin
|
c7cd1d7fe4
feat: 更新PDF列表并移除PP-StructureV3处理器的冗余配置
|
hai 1 semana |
zhch158_admin
|
62190e9d59
feat: 添加OCR结果对比模块的详细说明文档
|
hai 1 semana |
zhch158_admin
|
1b1b1acb02
fix: 修正差异数据框的样式应用方法
|
hai 1 semana |
zhch158_admin
|
5a5e4015d6
Remove obsolete configuration file for OCR validation tool, including styles, UI settings, OCR data configurations, data sources, and pre-validation paths.
|
hai 1 semana |
zhch158_admin
|
d1b21341f2
feat: 添加OCR验证系统配置文件说明文档
|
hai 1 semana |
zhch158_admin
|
ad61e0ace2
fix: 修正OCR工具统计信息的显示文本
|
hai 1 semana |
zhch158_admin
|
672d58aaf3
feat: 改进表头检测逻辑,新增分类行判断,优化得分计算
|
hai 1 semana |
zhch158_admin
|
6414c446cf
Update file paths for OCR results comparison in compare_ocr_results.py
|
hai 1 semana |
zhch158_admin
|
979d73759e
feat: 调整长度比例检查逻辑,修改阈值以提高匹配准确性
|
hai 1 semana |
zhch158_admin
|
b98a9c626f
feat: 修改表格行检测逻辑,支持小于10行的表格进行全面检测
|
hai 1 semana |
zhch158_admin
|
e9e17431e8
feat: 注释掉过短候选文本的过滤逻辑,避免单字符匹配
|
hai 1 semana |
zhch158_admin
|
d813017609
feat: 更新默认配置文件路径,指向新的 PaddleOCR_VL 和 PaddleOCR 文件
|
hai 1 semana |
zhch158_admin
|
038666f9ed
feat: 优化 PaddleOCR_VL 数据处理逻辑,移除不必要的格式转换
|
hai 1 semana |
zhch158_admin
|
6e15bf3df4
feat: 更新默认配置文件路径,指向新的数据集位置
|
hai 1 semana |
zhch158_admin
|
7930c6cd71
feat: 添加对 PaddleOCR_VL 数据的旋转角度和原始图像尺寸处理,优化 bbox 坐标转换
|
hai 1 semana |
zhch158_admin
|
2ec53f5194
feat: 添加旋转角度处理和原始图像尺寸获取功能,支持坐标反向旋转
|
hai 1 semana |
zhch158_admin
|
788e93532b
feat: 添加文件路径检查,确保切换数据源时路径有效
|
hai 1 semana |
zhch158_admin
|
d451e66d4c
feat: 添加 DotsOCR 和 PaddleOCR 合并程序,支持单文件和批量处理,输出为统一的MinerU格式
|
hai 1 semana |
zhch158_admin
|
6e82eedf30
feat: 添加 DotsOCR 和 PaddleOCR 合并模块,支持 JSON 数据合并和 Markdown 生成
|
hai 1 semana |
zhch158_admin
|
7018b3372e
feat: 添加 DotsOCR 数据处理功能,支持转换为 MinerU 格式并添加 bbox 信息
|
hai 1 semana |
zhch158_admin
|
810f8e84a7
feat: 添加 DotsOCR (带 cell bbox) 工具配置,支持结果目录和描述
|
hai 1 semana |
zhch158_admin
|
18549b7bc5
feat: 添加 2023年度报告母公司.pdf 到 PDF 列表
|
hai 1 semana |
zhch158_admin
|
1f38e81a65
fix: 修正 DotsOCR 的合并脚本映射,确保正确使用合并脚本
|
hai 1 semana |
zhch158_admin
|
a59da04cec
feat: 重构数据源选择器,优化文档和OCR工具选择逻辑,支持三列布局
|
hai 1 semana |
zhch158_admin
|
9dd6fc4a73
feat: 修改主函数,直接从会话状态获取验证器配置
|
hai 1 semana |
zhch158_admin
|
4a914d9089
feat: 修改 find_available_ocr_files_multi_source 函数,简化数据源唯一标识生成逻辑
|
hai 1 semana |
zhch158_admin
|
a8b6eabc3a
feat: 优化数据源名称生成逻辑,使用 result_dir 提高唯一性和清晰度
|
hai 1 semana |