zhch158_admin 26b500f344 feat: Add documentation for grid recovery scenarios in UNet, detailing causes of empty rows/columns and how `compress_grid` addresses them. 2 روز پیش
..
dotsocr 674b43692f feat: 添加多个文档和工具说明,包括 OCR 平台、表格识别模块及其评估算法 1 هفته پیش
legacy_table_line_generator 674b43692f feat: 添加多个文档和工具说明,包括 OCR 平台、表格识别模块及其评估算法 1 هفته پیش
mineru 39d16d50a7 fix: 更新 MinerU 文档中的交点计算结果 1 هفته پیش
ocr_tools 26b500f344 feat: Add documentation for grid recovery scenarios in UNet, detailing causes of empty rows/columns and how `compress_grid` addresses them. 2 روز پیش
paddlex 674b43692f feat: 添加多个文档和工具说明,包括 OCR 平台、表格识别模块及其评估算法 1 هفته پیش
README.md 674b43692f feat: 添加多个文档和工具说明,包括 OCR 平台、表格识别模块及其评估算法 1 هفته پیش

README.md

OCR Platform 文档

本目录包含 OCR Platform 项目的详细文档,按工具分类组织。

目录结构

docs/
├── paddlex/                    # PaddleX 相关文档
│   ├── README.md              # PaddleX 环境配置和使用说明
│   ├── PaddleOCR-VL-说明.md   # PaddleOCR-VL 使用说明
│   ├── PP-StructureV3-说明.md # PP-StructureV3 使用说明
│   └── ...
├── mineru/                     # MinerU 相关文档
│   ├── README.md              # MinerU 环境配置和使用说明
│   ├── mineru_处理流程.md      # MinerU 处理流程
│   └── ...
├── dotsocr/                    # DotsOCR 相关文档
│   ├── README.md              # DotsOCR 环境配置和使用说明
│   └── get_image_by_fitz.md   # 图像提取说明
├── ocr_tools/                  # OCR 工具详细技术文档
│   ├── ocr_merger/            # OCR 结果合并算法文档
│   │   ├── README.md          # OCR 合并工具说明
│   │   ├── 坐标系变换.md      # 坐标系变换详解
│   │   ├── 表格行匹配算法详解.md
│   │   └── ...
│   ├── universal_doc_parser/  # 统一文档解析器文档
│   │   ├── 模型统一框架.md
│   │   ├── Layout后处理-文本转表格.md
│   │   └── ...
│   └── pytorch_models/        # PyTorch 模型文档
│       └── onnx转换、推理算法.md
└── legacy_table_line_generator/ # 遗留表格线生成器文档
    └── 无线表格智能标注.md

快速导航

PaddleX 文档

MinerU 文档

DotsOCR 文档

OCR 工具技术文档

遗留工具文档

注意事项

  • 各源代码目录(如 ocr_tools/paddle_vl_tool/)只保留简要的 README.md,详细文档请查看本目录
  • 结果文件(如 OmniDocBench_*_Results/)不包含在文档中
  • 如需查找特定功能的文档,请使用搜索功能或查看对应工具的目录