|
@@ -317,6 +317,20 @@ ocr:
|
|
|
|
|
|
|
|
### 合并 MinerU 和 Paddle OCR 结果
|
|
### 合并 MinerU 和 Paddle OCR 结果
|
|
|
```bash
|
|
```bash
|
|
|
|
|
+# A用户_单元格扫描流水
|
|
|
|
|
+python merge_mineru_paddle_ocr.py \
|
|
|
|
|
+ --mineru-dir "/Users/zhch158/workspace/data/流水分析/A用户_单元格扫描流水/mineru-vlm-2.5.3_Results" \
|
|
|
|
|
+ --paddle-dir "/Users/zhch158/workspace/data/流水分析/A用户_单元格扫描流水/data_PPStructureV3_Results" \
|
|
|
|
|
+ --output-dir "/Users/zhch158/workspace/data/流水分析/A用户_单元格扫描流水/merged_results" \
|
|
|
|
|
+ --format "both"
|
|
|
|
|
+
|
|
|
|
|
+# B用户_扫描流水
|
|
|
|
|
+python merge_mineru_paddle_ocr.py \
|
|
|
|
|
+ --mineru-dir "/Users/zhch158/workspace/data/流水分析/B用户_扫描流水/mineru-vlm-2.5.3_Results" \
|
|
|
|
|
+ --paddle-dir "/Users/zhch158/workspace/data/流水分析/B用户_扫描流水/data_PPStructureV3_Results" \
|
|
|
|
|
+ --output-dir "/Users/zhch158/workspace/data/流水分析/B用户_扫描流水/merged_results" \
|
|
|
|
|
+ --format "both"
|
|
|
|
|
+
|
|
|
# 德_内蒙古银行照
|
|
# 德_内蒙古银行照
|
|
|
python merge_mineru_paddle_ocr.py \
|
|
python merge_mineru_paddle_ocr.py \
|
|
|
--mineru-dir "/Users/zhch158/workspace/data/流水分析/德_内蒙古银行照/mineru-vlm-2.5.3_Results" \
|
|
--mineru-dir "/Users/zhch158/workspace/data/流水分析/德_内蒙古银行照/mineru-vlm-2.5.3_Results" \
|