zhengchun

zhengchun zhengchun/ocr_platform zamanında main buraya push yaptı

  • 5bb909781f feat(新增水印去除策略): 添加两层独立的水印去除能力,支持PDF层级和图像级水印处理

6 gün önce

zhengchun zhengchun/ocr_platform zamanında main buraya push yaptı

  • de041fe413 feat(更新VL识别配置): 将GLM-OCR模块更改为PaddleOCR,更新相关参数以支持更大的图片尺寸和并发处理
  • 2fb3ee41cd feat(添加模型别名支持): 在paddle_local_daemon.sh中添加模型别名配置,并在启动和配置输出中显示
  • d1f002e9a7 feat(更新杨万益_福建农信文档配置): 修改输入输出路径和配置文件,更新日志文件路径
  • Bu 3 işlemeler için karşılaştırmaları görüntüle »

1 hafta önce

zhengchun zhengchun/ocr_platform zamanında main buraya push yaptı

  • abedc4e5b6 feat(更新PDF分类工具注释): 添加PDF分类工具的注释,说明优先使用MinerU原版及延迟导入策略
  • fadba9a24b fix(修复MinerU组件导入路径): 修改MinerU组件的导入路径以确保正确加载
  • 8032c96d96 feat(新增PDF文档类型分类工具): 添加PDF文档类型分类功能,支持判断可提取文本或需OCR
  • 17d86604f4 feat(更新杨万益_福建农信文档配置): 修改输入输出路径和配置文件,添加日志文件路径
  • a2d8a22d91 feat(新增杨万益_福建农信文档配置): 添加杨万益_福建农信的OCR工具及结果目录配置
  • Bu 15 işlemeler için karşılaştırmaları görüntüle »

1 hafta önce

zhengchun zhengchun/ocr_platform zamanında main buraya push yaptı

2 hafta önce

zhengchun zhengchun/ocr_platform zamanında main buraya push yaptı

  • d5620857e3 feat(新增本地银行流水处理器配置): 添加bank_statement_yusys_local配置以支持本地GLM-OCR处理
  • cc7098b12b feat(增强调试功能): 更新流水线初始化和配置,支持多种调试模式覆盖配置文件设置
  • d196e091a2 feat(新增银行交易流水场景配置): 添加bank_statement_yusys_local.yaml以支持银行流水OCR处理
  • 9b8ee548e6 feat(新增本地OCR处理器配置): 添加yusys_ocr_local处理器配置以支持银行对账单场景
  • 04a2536ac9 feat(新增本地PDF文件列表): 添加本地PDF文件列表以支持银行对账单和财务报告场景
  • Bu 8 işlemeler için karşılaştırmaları görüntüle »

2 hafta önce

zhengchun zhengchun/ocr_platform zamanında main buraya push yaptı

  • 24f1406736 feat(normalize_financial_numbers): 优化金额规范化逻辑,增加对纯整数和正确小数格式的直接返回处理
  • 8d5d0a9f3e feat(process_single_input): 优化调试模式处理,确保命令行参数优先级最高
  • c669c3c99a feat(pipeline_manager): 添加调试模式参数以增强元素处理的灵活性
  • f3ae94099b feat(element_processors): 添加调试模式选项以增强表格识别的灵活性
  • 9a25df70fd refactor(config): 禁用所有配置文件中的调试模式以提高性能
  • Bu 7 işlemeler için karşılaştırmaları görüntüle »

2 hafta önce

zhengchun zhengchun/ocr_platform zamanında main buraya push yaptı

  • 1e4a3fa9b9 refactor(normalize_financial_numbers): 优化金额 token 规范化逻辑,增强对多种格式的支持

2 hafta önce

zhengchun zhengchun/ocr_platform zamanında main buraya push yaptı

  • 11668f177e refactor(output_formatter_v2): 移除冗余的金额标准化逻辑,更新保存中间JSON的注释以反映标准化已在处理管道中完成
  • 6e96478c23 feat(ocr_utils): 增强金额标准化功能,支持欧洲格式小数和JSON表格内容的标准化处理
  • 40bad356ee refactor(markdown_generator): 移除冗余的金额标准化逻辑,更新Markdown生成以包含标准化变更说明
  • 1ce742a4ef refactor(json_formatters): 移除冗余的金额标准化逻辑,更新JSON输出以包含标准化变更记录
  • 38f373384f feat(pipeline_manager): 添加 normalize_numbers 参数以支持表格内容的金额标准化处理
  • Bu 7 işlemeler için karşılaştırmaları görüntüle »

2 hafta önce

zhengchun zhengchun/ocr_platform zamanında main buraya push yaptı

1 ay önce

zhengchun zhengchun/ocr_platform zamanında main buraya push yaptı

  • 10dad08fb0 fix(ocr_validator_utils): 更新 MinerU 版本显示名称
  • 6d0491be49 fix(glmocr_vl_adapter): 更新模型参数以提高识别性能,调整最大令牌数、温度、top_p 和 top_k 值
  • 4715244ada fix(compare_ocr_results): 更新测试文件路径和输出目录以反映新的数据结构 fix(content_extractor): 改进表格匹配正则表达式以支持带属性的表格
  • Bu 3 işlemeler için karşılaştırmaları görüntüle »

1 ay önce

zhengchun zhengchun/ocr_platform zamanında main buraya push yaptı

1 ay önce

zhengchun zhengchun/ocr_platform zamanında main buraya push yaptı

1 ay önce

zhengchun zhengchun/ocr_platform zamanında main buraya push yaptı

  • 0e20f6612e feat(config): 更新默认配置,切换至 GLM-VL 模型,调整页面范围和日志文件路径
  • 85626ae88e feat(config): 添加 YUSYS-OCR v4.0 支持,更新多个文档的 OCR 工具配置
  • 451b26652d feat(markdown_generator): 添加印章类型支持,增强 Markdown 输出功能
  • 90fc1b8ed4 feat(tests): 添加 GLM-OCR 适配器和 API 测试用例,验证适配器加载和 API 调用
  • 371113b468 feat(adapter): 添加 GLM-OCR 适配器支持,增强模型适配器功能
  • Bu 12 işlemeler için karşılaştırmaları görüntüle »

1 ay önce

zhengchun zhengchun/ocr_platform zamanında main buraya push yaptı

  • d3a9545849 fix(pp_doclayout_v3_layout_adapter): update image path for testing in main function

1 ay önce

zhengchun zhengchun/ocr_platform zamanında main buraya push yaptı

1 ay önce

zhengchun zhengchun/ocr_platform zamanında main buraya push yaptı

  • 02982fb29b feat(pdf_list): 添加多个新的PDF文件以扩展文档列表

2 ay önce

zhengchun zhengchun/ocr_platform zamanında main buraya push yaptı

2 ay önce

zhengchun zhengchun/ocr_platform zamanında main buraya push yaptı

  • d602b87e58 feat(OCRLayoutManager): 优化表格高亮处理,仅高亮文本而非整个单元格

2 ay önce

zhengchun zhengchun/ocr_platform zamanında main buraya push yaptı

2 ay önce

zhengchun zhengchun/ocr_platform zamanında main buraya push yaptı

2 ay önce