História revízii

Autor SHA1 Správa Dátum
  zhch158_admin 0b7809226c feat: 添加PaddleOCR表格分类器适配器,支持有线/无线表格分类 3 dní pred
  zhch158_admin 630cf15a2d feat: 添加表格分类器支持,优化表格识别路径选择 3 dní pred
  zhch158_admin 57bcb4628d feat: 添加创建表格分类器的方法以区分有线/无线表格 3 dní pred
  zhch158_admin 768858cbff feat: 添加可选的表格分类器参数以支持有线/无线表格的区分 3 dní pred
  zhch158_admin a4b4be0968 feat: 添加布局后处理和表格分类配置,优化表格识别逻辑 3 dní pred
  zhch158_admin c11f2ea045 feat: 添加 detect_page_type 方法以检测 PDF 页面类型(文本或扫描OCR) 3 dní pred
  zhch158_admin f2079d9e4f feat: 添加 detect_page_type 函数以检测 PDF 页面的类型(文字页或图片页) 3 dní pred
  zhch158_admin ca0374db5f feat: 添加 pdf_type 参数以支持不同的 PDF 处理模式,优化识别逻辑 3 dní pred
  zhch158_admin 54f5b5943d fix: 将日志级别从 info 更改为 debug,以减少输出冗余 3 dní pred
  zhch158_admin 9d7afeff31 feat: 添加 pdf_type 参数以支持不同的 OCR 模式,优化二次 OCR 逻辑 3 dní pred
  zhch158_admin bfd018969b fix: 将日志级别从 info 更改为 debug,以减少输出冗余 3 dní pred
  zhch158_admin e4304a8c0e feat: 增强 PDF 文本提取逻辑,添加页级别类型检测,优化 OCR 使用条件 3 dní pred
  zhch158_admin d68f33b382 feat: 添加 PDF 类型检测功能,优化文档处理逻辑,支持文本和 OCR 页面的识别 3 dní pred
  zhch158_admin 58d9568b0f feat: add PDF text extraction module and refactor PDF utilities 4 dní pred
  zhch158_admin e8a1f6ece8 feat: 添加 PDF 旋转验证测试程序,支持不同角度的文本坐标验证与渲染一致性 4 dní pred
  zhch158_admin f86659f440 fix: 更新日志信息,包含倾斜阈值以便于调试 4 dní pred
  zhch158_admin 752de6fa64 fix: 优化 OCR 重新识别逻辑,调整置信度阈值并移除不必要的旋转处理 4 dní pred
  zhch158_admin 3b53b1f441 fix: 调整边缘过滤参数,修正 crop_padding 对应的计算逻辑 4 dní pred
  zhch158_admin 6791737004 feat: 增强 OCR 处理逻辑,支持 PDF 旋转角度提取与 OCR 结果对比 4 dní pred
  zhch158_admin e698e7ca1e fix: 调整 unclip_ratio 参数值以优化 OCR 识别效果 4 dní pred
  zhch158_admin dd92babb27 feat: 改进文档处理流程,支持从 PDF 提取文本并与 OCR 结果对比,添加调试模式 4 dní pred
  zhch158_admin dc9a615776 fix: 修复加载和分类文档时的参数传递,添加 renderer_used 参数 4 dní pred
  zhch158_admin 85f5dfa1f4 feat: 更新 process_text_element 方法,改进预匹配 spans 的处理逻辑,支持 OCR 和 PDF 文本提取来源 4 dní pred
  zhch158_admin 43d0e1c5d3 feat: 在 bank_statement_wired_unet 配置中启用调试模式 4 dní pred
  zhch158_admin db1a81a141 feat: 添加 PDF 文档类型检测功能,支持 pypdfium2 和 fitz 渲染引擎,优化文本提取过程 4 dní pred
  zhch158_admin 939c825128 feat: Add `.gitignore` to exclude common development artifacts and specific project paths, and update `main_v2.py`. 4 dní pred
  zhch158_admin ae0a19dc4d chore: Add .gitignore to exclude various development and output files, and update main_v2.py. 5 dní pred
  zhch158_admin 481b5ea371 feat: add .gitignore to exclude common development artifacts, temporary files, and specific project outputs. 5 dní pred
  zhch158_admin a4b8405df5 feat: 添加 bank_statement_wired_unet OCR 工具配置,支持结果目录和图像目录定义 5 dní pred
  zhch158_admin f90f868f20 feat: 添加边缘线过滤功能,优化线段提取过程以减少噪声 5 dní pred