表格结构识别模块
https://paddlepaddle.github.io/PaddleX/latest/module_usage/tutorials/ocr_modules/table_structure_recognition.html
python main.py -c zhch/table_structure_recognition/SLANet_plus.yaml \
-o Global.mode=check_dataset \
-o Global.dataset_dir=./dataset/table_rec_dataset_examples
python main.py -c zhch/table_structure_recognition/SLANet_plus.yaml \
-o Global.mode=train \
-o Global.dataset_dir=./dataset/table_rec_dataset_examples
python main.py -c zhch/table_structure_recognition/SLANet_plus.yaml -o Global.mode=evaluate
paddleocr
# 到PaddleX目录
cd PaddleX
#单卡训练 (默认训练方式)
python paddlex/repo_manager/repos/PaddleOCR/tools/train.py -c zhch/table_structure_recognition/SLANet_plus_paddleocr.yml \
-o Global.pretrained_model=/Users/zhch158/.paddleocr/models/SLANet_plus_pretrained.pdparams \
Train.dataset.data_dir=./dataset/table_rec_dataset_examples \
Train.dataset.label_file_list='[./dataset/table_rec_dataset_examples/train.txt]' \
Eval.dataset.data_dir=./dataset/table_rec_dataset_examples \
Eval.dataset.label_file_list='[./dataset/table_rec_dataset_examples/val.txt]'
# 注意将pretrained_model的路径设置为本地路径。若使用自行训练保存的模型,请注意修改路径和文件名为{path/to/weights}/{model_name}。
# demo 测试集评估
python paddlex/repo_manager/repos/PaddleOCR/tools/eval.py \
-c zhch/table_structure_recognition/SLANet_plus_paddleocr.yml \
-o Global.pretrained_model=./output/SLANet_plus/best_accuracy.pdparams \
Eval.dataset.data_dir=./dataset/table_rec_dataset_examples \
Eval.dataset.label_file_list='[./dataset/table_rec_dataset_examples/val.txt]'