zhengchun

zhengchun zhengchun/ocr_platform zamanında main buraya push yaptı

15 dakika önce

zhengchun zhengchun/ocr_platform zamanında main buraya push yaptı

3 saat önce

zhengchun zhengchun/ocr_platform zamanında main buraya push yaptı

  • 64652051e4 fix: 更新示例输入输出路径,修正注释以提高代码可读性
  • ca720abd31 fix: 增强UNet预处理的缩放因子验证,优化预测结果的尺寸一致性检查,记录详细的调试信息以确保坐标转换的准确性
  • 1fbcf06f4a fix: 增强文本填充器的OCR检测能力,支持跨单元格检测和输出调试图像,优化重叠检测逻辑
  • bb0acb2afc fix: 增强网格结构恢复中的坐标转换精度,添加调试信息以验证缩放比例和单元格覆盖情况
  • 3cf3aa5085 fix: 调整表格处理中的padding策略,优化边缘保护与噪声控制的平衡
  • Bu 7 işlemeler için karşılaştırmaları görüntüle »

1 gün önce

zhengchun zhengchun/ocr_platform zamanında main buraya push yaptı

  • 652b321bd6 feat: Update batch processing in main_v2.py to include output directory parameter for document processing, enhancing flexibility in file management.
  • 1bb438fba3 fix: Improve coordinate transformation accuracy in WiredTableVisualizer to reduce cumulative errors and enhance debugging with detailed logging of cell coordinates during visualization.
  • c628acd7b7 feat: Enhance text filling strategy in TextFiller class by introducing overlap ratio calculation for improved OCR box matching, optimizing performance with binary search, and refining text extraction logic.
  • 60aa86e4bf feat: Enhance GridRecovery class by adding optional parameters for original image dimensions and improving scaling logic for cell extraction, along with detailed debug logging for better traceability.
  • 26b500f344 feat: Add documentation for grid recovery scenarios in UNet, detailing causes of empty rows/columns and how `compress_grid` addresses them.
  • Bu 6 işlemeler için karşılaştırmaları görüntüle »

2 gün önce

zhengchun zhengchun/ocr_platform zamanında main buraya push yaptı

  • 3a5b2ab300 chore: Add .gitignore and a script to verify GridRecovery module import and cell computation with mocked dependencies.
  • 76f8e864a8 feat: Add .gitignore, implement grid recovery syntax verification, and enhance HuggingFace model loading with local cache prioritization.
  • e355727495 feat: Add wired table processing modules, `wired_table` adapter, and enhance HuggingFace model caching in `docling_layout_adapter`.
  • a4ad1d803a feat: Implement wired table processing with grid recovery and skew detection, and improve HuggingFace model caching.
  • 4f32495604 feat: Introduce new wired table processing module with enhanced skew detection, grid recovery, and output capabilities, and update pipeline to utilize it.
  • Bu 16 işlemeler için karşılaştırmaları görüntüle »

3 gün önce

zhengchun zhengchun/ocr_platform zamanında main buraya push yaptı

  • d163421bd0 feat: 添加动态过滤逻辑以优化有线表格识别中的噪声处理

6 gün önce

zhengchun zhengchun/ocr_platform zamanında main buraya push yaptı

6 gün önce

zhengchun zhengchun/ocr_platform zamanında main buraya push yaptı

6 gün önce

zhengchun zhengchun/ocr_platform zamanında main buraya push yaptı

  • 808f38d864 feat: 更新 DiT 和 Detectron2 模型对比分析,增强文档内容 - 在文档中新增 DiT + Detectron2 的适用场景和优势描述,强调其在学术论文布局检测中的表现。 - 更新 DiT 模型的劣势部分,增加对训练数据依赖性的说明,提升用户对模型选择的理解。 - 增加 RT-DETR (Docling) 模型的介绍,扩展布局检测模型的比较视角。
  • 4ec22c91f7 feat: 新增 Docling RT-DETR 与 DiT 模型性能对比分析文档 - 创建新的 Markdown 文档,详细分析 Docling RT-DETR 和 DiT 在财务报表处理中的性能差异。 - 通过对比训练数据、类别体系、模型微调策略和后处理策略,阐明 Docling 在商业文档适配性上的优势。 - 提供实际效果对比和模型选择建议,帮助用户在不同文档类型中做出更优选择。 - 文档包含技术细节、模型选择决策树和解决方案建议,旨在提升用户对布局检测技术的理解和应用能力。
  • bdc29cb5a4 feat: 新增 DiT Layout Detector 测试脚本 - 创建测试脚本以验证 DiT Layout Detector 适配器的功能,支持 PDF、图像和目录输入。 - 实现页面范围过滤、布局检测和结果统计功能,提供可视化结果保存选项。 - 添加命令行参数解析,支持自定义配置和模型权重设置,提升测试灵活性和可用性。
  • 23326cb1b6 feat: 增强布局处理工具类,新增类别合并限制和误检过滤功能 - 在 LayoutUtils 中添加类别合并限制和优先级处理,确保高优先级类别框不被低优先级框覆盖。 - 实现过滤误检图片框的功能,依据文本面积比例判断是否移除图片框。 - 更新 remove_overlapping_boxes 方法,支持面积限制和类别优先级的合并策略。 - 更新 DitLayoutDetector 类,增加新配置选项以启用上述功能,提升布局检测的准确性和可靠性。
  • a8e2a5d3e2 feat: 新增文档版面检测模型发展路径整理文档 - 创建新的文档,系统梳理文档版面检测模型的发展历程,使用 mermaid 图表进行多视角对比和分析。 - 包含发展路线图、技术演进路径、核心模型对比及详细对比表,提供全面的技术细节和应用场景选择指南。 - 旨在提升用户对文档布局检测技术的理解和应用能力。
  • Bu 10 işlemeler için karşılaştırmaları görüntüle »

1 hafta önce

zhengchun zhengchun/ocr_platform zamanında main buraya push yaptı

  • 9375927c14 feat: 重构 README 文档,更新项目介绍和功能概述 - 将 README 文档重命名为 "OCR Platform",并添加项目的整体介绍和核心功能。 - 详细列出支持的 OCR 工具、结果处理、表格处理和工具集功能。 - 更新环境配置部分,提供多种 Python 环境的选择和详细链接。 - 增加快速开始和模块说明,提升用户对项目的理解和使用体验。
  • 9733ac0b36 feat: 更新多个工具的 README 文档,添加详细文档链接 - 在 DotsOCR、MinerU、PaddleOCR 和 PP-StructureV3 的 README 中新增详细文档链接,提供技术文档、环境配置和参数说明。 - 删除不再需要的文档文件,优化项目结构。 - 更新 OCR 合并工具的相关文档,提升用户体验和可读性。
  • 5f5e88e396 feat: 新增表格线生成器模块及其核心功能 - 添加自适应行分割器、列边界检测器、智能表格线生成器和批量处理器,支持无线表格的智能标注。 - 引入表格线可视化编辑器,允许用户手动调整表格线位置。 - 更新 README 文档,详细说明模块功能和使用示例。 - 实现批量处理功能,支持多页交易流水的快速处理和结果导出。
  • 674b43692f feat: 添加多个文档和工具说明,包括 OCR 平台、表格识别模块及其评估算法 - 新增 OCR Platform 文档,详细介绍项目结构和使用注意事项。 - 添加表格识别模块的 README,涵盖环境选择和使用示例。 - 引入表格行匹配算法和评估指标的详细说明,包括 BLEU、F1、METEOR 和 TEDS。 - 更新 PaddleX 和 MinerU 的相关文档,提供统一的 PyTorch 模型接口和输出格式说明。
  • Bu 4 işlemeler için karşılaştırmaları görüntüle »

1 hafta önce

zhengchun zhengchun/ocr_platform zamanında main buraya push yaptı

  • 3f977e0137 feat: replace old template with updated version for 康强_北京农村商业银行, including new line data and relative coordinates
  • ea5e18400a feat: 添加表格线条生成器 README 文档,包含功能特性、技术栈、使用说明及项目结构
  • d56b4db109 feat: 添加表格线生成器模块,提供 OCR 数据解析、表格结构分析、线条编辑和批量处理功能
  • e0f3bbe92d feat: add history management and template handling in the editor - Implemented a history store for undo/redo functionality with a maximum history limit. - Created a template store to manage templates, file pairs, and data source configurations. - Developed the EditorView component to handle file uploads, template applications, and batch processing. - Added global styles for the editor layout and components. - Defined TypeScript interfaces for editor state, templates, and data sources. - Configured TypeScript and Vite for the frontend project.
  • 7514e88766 feat: 添加表格线编辑器核心模块,包括 OCR 解析、表格结构分析和绘图服务

1 hafta önce

zhengchun main at zhengchun/ocr_platform yeni şubesi oluşturuldu

1 hafta önce

zhengchun depo zhengchun/ocr_platform oluşturuldu

1 hafta önce