zhch158_admin
|
6e827e2f76
feat: 更新Mineru数据源描述,新增整合PaddleOCR坐标的识别结果
|
1 lună în urmă |
zhch158_admin
|
1bd52e4660
feat: 新增合并 MinerU 和 PaddleOCR 结果的功能,支持批量处理和生成增强的 Markdown
|
1 lună în urmă |
zhch158_admin
|
bac13fece9
feat: 更新README文档,增强OCR可视化验证系统的功能描述和使用指南
|
1 lună în urmă |
zhch158_admin
|
2aa94dd62e
对代码进行结构整理
|
1 lună în urmă |
zhch158_admin
|
0c68266c77
分模块前代码逻辑
|
1 lună în urmă |
zhch158_admin
|
e105144bb3
feat: 增强交叉验证功能,支持批量比对和结果报告生成
|
1 lună în urmă |
zhch158_admin
|
b410809491
fix: 统一比较结果中的错误类型,细化统计信息,改进输出格式
|
1 lună în urmă |
zhch158_admin
|
1a54d8c159
feat: 新增Streamlit OCR可视化校验工具,支持多数据源加载和VLM预校验功能
|
1 lună în urmă |
zhch158_admin
|
1a1388c344
feat: 新增交叉验证功能,支持选择不同数据源进行OCR结果比对
|
1 lună în urmă |
zhch158_admin
|
5cf9fb3b25
fix: 修复比较结果输出格式,确保在报告中正确显示差异信息
|
1 lună în urmă |
zhch158_admin
|
18fbf8f769
feat: 采用difflib的统一差异比较功能,支持生成JSON和Markdown报告
|
1 lună în urmă |
zhch158_admin
|
f249f82fe6
feat: Enhance OCR result comparison with table header detection and flexible similarity algorithms
|
1 lună în urmă |
zhch158_admin
|
a6a21562a8
新增字符串相似度算法文档,详细解释四种算法及其适用场景和例子
|
1 lună în urmă |
zhch158_admin
|
9b12ce8da7
优化ocr_validator_utils和ocr_validator_file_utils模块的导入结构,提升代码可读性
|
1 lună în urmă |
zhch158_admin
|
a31751a8ab
重构OCR工具配置,增强对MinerU数据的支持,优化工具类型检测逻辑
|
1 lună în urmă |
zhch158_admin
|
a0b3e34f35
优化导入顺序,调整ocr_validator_utils和ocr_validator_file_utils模块的导入结构
|
1 lună în urmă |
zhch158_admin
|
72ddd4812f
新增OCR工具功能,支持HTML和Markdown内容中图片引用的处理,增强图片查找和转换为base64的能力
|
1 lună în urmă |
zhch158_admin
|
e6484d53be
新增MinerU OCR工具配置及数据源,支持多用户扫描结果处理
|
1 lună în urmă |
zhch158_admin
|
0d50311967
优化表格显示逻辑,增加超宽表格列数阈值配置
|
1 lună în urmă |
zhch158_admin
|
d2b84c7836
处理MD内容中的所有图片引用
|
1 lună în urmă |
zhch158_admin
|
7ea2c49766
优化高亮文本渲染,调整标题显示逻辑以完整展示文本内容
|
1 lună în urmă |
zhch158_admin
|
49685be45f
新增德_内蒙古银行照和对公_招商银行图的数据源配置,使用PPStructV3工具进行图片合成结果处理
|
1 lună în urmă |
zhch158_admin
|
9ca9e56a55
优化parse_table_recognition_v2_data函数,改进表格整体bbox计算逻辑,调整嵌套文本框处理方式
|
1 lună în urmă |
zhch158_admin
|
c24fc1f746
移除数据统计标签页,优化表格分析页面布局,调整表格数据预览展示逻辑
|
1 lună în urmă |
zhch158_admin
|
e3ebf68f19
优化ppstructv3数据解析逻辑,新增table_recognition_v2数据解析功能,支持嵌套字段提取
|
1 lună în urmă |
zhch158_admin
|
f9cf323e46
新增Table Recognition V2工具配置,优化OCR工具类型检测逻辑,支持表格识别结果
|
1 lună în urmă |
zhch158_admin
|
d148122e35
新增VLM预校验识别结果标签页,优化OCR结果与VLM结果的对比展示逻辑
|
1 lună în urmă |
zhch158_admin
|
a8dab89a60
去掉生成文本中的markdown标记,优化文本处理逻辑
|
1 lună în urmă |
zhch158_admin
|
3a5c135bce
修复预验证目录配置,更新为从配置文件中获取输出目录
|
1 lună în urmă |
zhch158_admin
|
2e28b3819a
新增至远彩色2023年报的数据源配置,支持Dots OCR和PPStructV3工具
|
1 lună în urmă |