提交歷史

作者 SHA1 備註 提交日期
  zhch158_admin 11668f177e refactor(output_formatter_v2): 移除冗余的金额标准化逻辑,更新保存中间JSON的注释以反映标准化已在处理管道中完成 2 周之前
  zhch158_admin 6e96478c23 feat(ocr_utils): 增强金额标准化功能,支持欧洲格式小数和JSON表格内容的标准化处理 2 周之前
  zhch158_admin 40bad356ee refactor(markdown_generator): 移除冗余的金额标准化逻辑,更新Markdown生成以包含标准化变更说明 2 周之前
  zhch158_admin 1ce742a4ef refactor(json_formatters): 移除冗余的金额标准化逻辑,更新JSON输出以包含标准化变更记录 2 周之前
  zhch158_admin 38f373384f feat(pipeline_manager): 添加 normalize_numbers 参数以支持表格内容的金额标准化处理 2 周之前
  zhch158_admin 2b8ed01af2 feat(element_processors): 添加金额标准化功能,支持表格内容的财务数字规范化处理 2 周之前
  zhch158_admin 35c6e6cf36 feat(ocr_utils): 增强财务数字标准化功能,添加金额 token 纠错逻辑,支持逗号和小数点的正确用法 2 周之前
  zhch158_admin 2e8ed5fad9 fix(VLM服务地址): 修复ppstructure_v3重复条目,添加glm_vllm地址 1 月之前
  zhch158_admin 3f3bde9d60 feat(universal_doc_parser): 增强模型选择与识别功能,支持GLM-OCR和多源单元格融合 1 月之前
  zhch158_admin 10dad08fb0 fix(ocr_validator_utils): 更新 MinerU 版本显示名称 1 月之前
  zhch158_admin 6d0491be49 fix(glmocr_vl_adapter): 更新模型参数以提高识别性能,调整最大令牌数、温度、top_p 和 top_k 值 1 月之前
  zhch158_admin 4715244ada fix(compare_ocr_results): 更新测试文件路径和输出目录以反映新的数据结构 1 月之前
  zhch158_admin db2f73aa2e feat(batch_process_pdf): 添加场景参数处理逻辑,支持默认场景参数名和必填校验 1 月之前
  zhch158_admin a2ddb4c408 fix(cell_fusion): 移除过滤条件中的 'unet_only' 标记,并添加极薄/极窄噪声框过滤 1 月之前
  zhch158_admin abf5932769 fix(markdown_generator): 移除印章置信度信息以简化输出格式 1 月之前
  zhch158_admin 4ede25dc86 feat(process_single_input): 添加场景名称设置功能并更新场景参数 1 月之前
  zhch158_admin 87c5b916fb feat(pipeline_manager): 添加场景名称设置功能,并同步到布局路由器 1 月之前
  zhch158_admin 3ab44b691b feat(layout_detection): 更新布局检测配置,支持智能路由器场景选择和多模型配置 1 月之前
  zhch158_admin 10872b84e9 feat(pdf_processing): 添加场景参数支持,优化 PDF 处理任务配置 1 月之前
  zhch158_admin 59f2fdd74c feat(glmocr_vl_adapter): 添加连通性测试以验证与 GLM-OCR API 的连接 1 月之前
  zhch158_admin 08cfd7cd25 fix(element_processors): 优化表格识别中的 VL 识别器异常处理逻辑 1 月之前
  zhch158_admin d2258858b5 feat(paddle_table_classifier): 优化表格线检测,使用自适应阈值和线段过滤 1 月之前
  zhch158_admin 73f20ff9e2 feat(mineru_wired_table): 添加 OCR 文本容差计算,优化网格结构恢复 1 月之前
  zhch158_admin 93977737f5 feat(grid_recovery): 增加 OCR 文本容差参数,优化网格结构恢复算法 1 月之前
  zhch158_admin ce673e8fc6 feat(cell_fusion): 增强单元格融合逻辑,支持UNet过度合并拆分,添加新配置参数 1 月之前
  zhch158_admin 0e20f6612e feat(config): 更新默认配置,切换至 GLM-VL 模型,调整页面范围和日志文件路径 1 月之前
  zhch158_admin 85626ae88e feat(config): 添加 YUSYS-OCR v4.0 支持,更新多个文档的 OCR 工具配置 1 月之前
  zhch158_admin 451b26652d feat(markdown_generator): 添加印章类型支持,增强 Markdown 输出功能 1 月之前
  zhch158_admin 90fc1b8ed4 feat(tests): 添加 GLM-OCR 适配器和 API 测试用例,验证适配器加载和 API 调用 1 月之前
  zhch158_admin 371113b468 feat(adapter): 添加 GLM-OCR 适配器支持,增强模型适配器功能 1 月之前