|
|
2 veckor sedan | |
|---|---|---|
| .. | ||
| infer | 2 veckor sedan | |
| pytorchocr | 2 veckor sedan | |
| README.md | 2 veckor sedan | |
| __init__.py | 2 veckor sedan | |
| device_utils.py | 2 veckor sedan | |
| ocr_utils.py | 2 veckor sedan | |
| pytorch_paddle.py | 2 veckor sedan | |
本目录包含从 MinerU 提取的核心 OCR 模块。
vendor/
├── __init__.py
├── ocr_utils.py # OCR 工具函数
├── pytorchocr/ # PytorchOCR 核心(需要手动复制)
│ ├── __init__.py
│ └── predict_system.py # TextSystem 主类
└── README.md
由于 pytorchocr 模块较大,需要手动从 MinerU 复制:
# 1. 复制核心模块
cp -r /Users/zhch158/workspace/repository.git/MinerU/mineru/model/utils/tools/infer/ \
vendor/infer/
# 2. 复制依赖的其他模块(如果需要)
cp -r /Users/zhch158/workspace/repository.git/MinerU/mineru/model/utils/pytorchocr/ \
vendor/pytorchocr/
mineru_ocr_adapter.py 中的导入路径~/.cache/modelscope/hub/models/OpenDataLab/ 下如果 vendor 方式有问题,可以直接在运行时添加 MinerU 到 PYTHONPATH:
import sys
from pathlib import Path
mineru_root = Path("/Users/zhch158/workspace/repository.git/MinerU").resolve()
sys.path.insert(0, str(mineru_root))
pip install omegaconf