zhch158_admin
|
18fbf8f769
feat: 采用difflib的统一差异比较功能,支持生成JSON和Markdown报告
|
1 tháng trước cách đây |
zhch158_admin
|
f249f82fe6
feat: Enhance OCR result comparison with table header detection and flexible similarity algorithms
|
1 tháng trước cách đây |
zhch158_admin
|
a6a21562a8
新增字符串相似度算法文档,详细解释四种算法及其适用场景和例子
|
1 tháng trước cách đây |
zhch158_admin
|
9b12ce8da7
优化ocr_validator_utils和ocr_validator_file_utils模块的导入结构,提升代码可读性
|
1 tháng trước cách đây |
zhch158_admin
|
a31751a8ab
重构OCR工具配置,增强对MinerU数据的支持,优化工具类型检测逻辑
|
1 tháng trước cách đây |
zhch158_admin
|
a0b3e34f35
优化导入顺序,调整ocr_validator_utils和ocr_validator_file_utils模块的导入结构
|
1 tháng trước cách đây |
zhch158_admin
|
72ddd4812f
新增OCR工具功能,支持HTML和Markdown内容中图片引用的处理,增强图片查找和转换为base64的能力
|
1 tháng trước cách đây |
zhch158_admin
|
e6484d53be
新增MinerU OCR工具配置及数据源,支持多用户扫描结果处理
|
1 tháng trước cách đây |
zhch158_admin
|
0d50311967
优化表格显示逻辑,增加超宽表格列数阈值配置
|
1 tháng trước cách đây |
zhch158_admin
|
d2b84c7836
处理MD内容中的所有图片引用
|
1 tháng trước cách đây |
zhch158_admin
|
7ea2c49766
优化高亮文本渲染,调整标题显示逻辑以完整展示文本内容
|
1 tháng trước cách đây |
zhch158_admin
|
49685be45f
新增德_内蒙古银行照和对公_招商银行图的数据源配置,使用PPStructV3工具进行图片合成结果处理
|
1 tháng trước cách đây |
zhch158_admin
|
9ca9e56a55
优化parse_table_recognition_v2_data函数,改进表格整体bbox计算逻辑,调整嵌套文本框处理方式
|
1 tháng trước cách đây |
zhch158_admin
|
c24fc1f746
移除数据统计标签页,优化表格分析页面布局,调整表格数据预览展示逻辑
|
1 tháng trước cách đây |
zhch158_admin
|
e3ebf68f19
优化ppstructv3数据解析逻辑,新增table_recognition_v2数据解析功能,支持嵌套字段提取
|
1 tháng trước cách đây |
zhch158_admin
|
f9cf323e46
新增Table Recognition V2工具配置,优化OCR工具类型检测逻辑,支持表格识别结果
|
1 tháng trước cách đây |
zhch158_admin
|
d148122e35
新增VLM预校验识别结果标签页,优化OCR结果与VLM结果的对比展示逻辑
|
1 tháng trước cách đây |
zhch158_admin
|
a8dab89a60
去掉生成文本中的markdown标记,优化文本处理逻辑
|
1 tháng trước cách đây |
zhch158_admin
|
3a5c135bce
修复预验证目录配置,更新为从配置文件中获取输出目录
|
1 tháng trước cách đây |
zhch158_admin
|
2e28b3819a
新增至远彩色2023年报的数据源配置,支持Dots OCR和PPStructV3工具
|
1 tháng trước cách đây |
zhch158_admin
|
f12a31556a
优化旋转角度获取逻辑,支持手动设置优先级,增强图像和坐标旋转处理
|
1 tháng trước cách đây |
zhch158_admin
|
fb8276c6fb
新增多数据源支持,重构文件加载逻辑,优化数据源选择器和统计信息显示
|
1 tháng trước cách đây |
zhch158_admin
|
5097154aca
优化load_ocr_data_file函数以支持多数据源配置,新增find_corresponding_image函数查找对应图片文件,添加find_available_ocr_files_multi_source函数以查找多个数据源的OCR文件
|
1 tháng trước cách đây |
zhch158_admin
|
4de46f76e1
移除文件路径配置,新增数据源配置以支持不同用户的OCR结果
|
1 tháng trước cách đây |
zhch158_admin
|
75e6e6d7ae
调整对比结果显示逻辑,新增详细参数以控制差异查看和下载选项的显示
|
1 tháng trước cách đây |
zhch158_admin
|
8f38c06a62
优化可用OCR文件查找逻辑,仅添加符合特定命名规则的JSON文件
|
1 tháng trước cách đây |
zhch158_admin
|
2e1eecddfd
移除财务数字标准化功能的实现,改为直接导入相关模块以简化代码
|
1 tháng trước cách đây |
zhch158_admin
|
6410af974b
添加财务数字标准化功能,支持全角字符转换为半角字符,并处理Markdown和JSON格式中的数字标准化
|
1 tháng trước cách đây |
zhch158_admin
|
520d9dcbc4
调整最大合并段落数,从3增加到6,以支持更多段落的合并
|
1 tháng trước cách đây |
zhch158_admin
|
310aa357b2
增强差异严重程度判断逻辑,支持直接使用差异中的严重程度和相似度进行评估
|
1 tháng trước cách đây |