Cronologia Commit

Autore SHA1 Messaggio Data
  zhch158_admin 18fbf8f769 feat: 采用difflib的统一差异比较功能,支持生成JSON和Markdown报告 1 mese fa
  zhch158_admin f249f82fe6 feat: Enhance OCR result comparison with table header detection and flexible similarity algorithms 1 mese fa
  zhch158_admin a6a21562a8 新增字符串相似度算法文档,详细解释四种算法及其适用场景和例子 1 mese fa
  zhch158_admin 9b12ce8da7 优化ocr_validator_utils和ocr_validator_file_utils模块的导入结构,提升代码可读性 1 mese fa
  zhch158_admin a31751a8ab 重构OCR工具配置,增强对MinerU数据的支持,优化工具类型检测逻辑 1 mese fa
  zhch158_admin a0b3e34f35 优化导入顺序,调整ocr_validator_utils和ocr_validator_file_utils模块的导入结构 1 mese fa
  zhch158_admin 72ddd4812f 新增OCR工具功能,支持HTML和Markdown内容中图片引用的处理,增强图片查找和转换为base64的能力 1 mese fa
  zhch158_admin e6484d53be 新增MinerU OCR工具配置及数据源,支持多用户扫描结果处理 1 mese fa
  zhch158_admin 0d50311967 优化表格显示逻辑,增加超宽表格列数阈值配置 1 mese fa
  zhch158_admin d2b84c7836 处理MD内容中的所有图片引用 1 mese fa
  zhch158_admin 7ea2c49766 优化高亮文本渲染,调整标题显示逻辑以完整展示文本内容 1 mese fa
  zhch158_admin 49685be45f 新增德_内蒙古银行照和对公_招商银行图的数据源配置,使用PPStructV3工具进行图片合成结果处理 1 mese fa
  zhch158_admin 9ca9e56a55 优化parse_table_recognition_v2_data函数,改进表格整体bbox计算逻辑,调整嵌套文本框处理方式 1 mese fa
  zhch158_admin c24fc1f746 移除数据统计标签页,优化表格分析页面布局,调整表格数据预览展示逻辑 1 mese fa
  zhch158_admin e3ebf68f19 优化ppstructv3数据解析逻辑,新增table_recognition_v2数据解析功能,支持嵌套字段提取 1 mese fa
  zhch158_admin f9cf323e46 新增Table Recognition V2工具配置,优化OCR工具类型检测逻辑,支持表格识别结果 1 mese fa
  zhch158_admin d148122e35 新增VLM预校验识别结果标签页,优化OCR结果与VLM结果的对比展示逻辑 1 mese fa
  zhch158_admin a8dab89a60 去掉生成文本中的markdown标记,优化文本处理逻辑 1 mese fa
  zhch158_admin 3a5c135bce 修复预验证目录配置,更新为从配置文件中获取输出目录 1 mese fa
  zhch158_admin 2e28b3819a 新增至远彩色2023年报的数据源配置,支持Dots OCR和PPStructV3工具 1 mese fa
  zhch158_admin f12a31556a 优化旋转角度获取逻辑,支持手动设置优先级,增强图像和坐标旋转处理 1 mese fa
  zhch158_admin fb8276c6fb 新增多数据源支持,重构文件加载逻辑,优化数据源选择器和统计信息显示 1 mese fa
  zhch158_admin 5097154aca 优化load_ocr_data_file函数以支持多数据源配置,新增find_corresponding_image函数查找对应图片文件,添加find_available_ocr_files_multi_source函数以查找多个数据源的OCR文件 1 mese fa
  zhch158_admin 4de46f76e1 移除文件路径配置,新增数据源配置以支持不同用户的OCR结果 1 mese fa
  zhch158_admin 75e6e6d7ae 调整对比结果显示逻辑,新增详细参数以控制差异查看和下载选项的显示 1 mese fa
  zhch158_admin 8f38c06a62 优化可用OCR文件查找逻辑,仅添加符合特定命名规则的JSON文件 1 mese fa
  zhch158_admin 2e1eecddfd 移除财务数字标准化功能的实现,改为直接导入相关模块以简化代码 1 mese fa
  zhch158_admin 6410af974b 添加财务数字标准化功能,支持全角字符转换为半角字符,并处理Markdown和JSON格式中的数字标准化 1 mese fa
  zhch158_admin 520d9dcbc4 调整最大合并段落数,从3增加到6,以支持更多段落的合并 1 mese fa
  zhch158_admin 310aa357b2 增强差异严重程度判断逻辑,支持直接使用差异中的严重程度和相似度进行评估 1 mese fa