README.md 1.7 KB

表格结构识别模块

https://paddlepaddle.github.io/PaddleX/latest/module_usage/tutorials/ocr_modules/table_structure_recognition.html

python main.py -c zhch/table_structure_recognition/SLANet_plus.yaml \
    -o Global.mode=check_dataset \
    -o Global.dataset_dir=./dataset/table_rec_dataset_examples

python main.py -c zhch/table_structure_recognition/SLANet_plus.yaml \
    -o Global.mode=train \
    -o Global.dataset_dir=./dataset/table_rec_dataset_examples

python main.py -c zhch/table_structure_recognition/SLANet_plus.yaml -o Global.mode=evaluate 

paddleocr

# 到PaddleX目录
cd PaddleX

#单卡训练 (默认训练方式)
python paddlex/repo_manager/repos/PaddleOCR/tools/train.py -c zhch/table_structure_recognition/SLANet_plus_paddleocr.yml \
    -o Global.pretrained_model=/Users/zhch158/.paddleocr/models/SLANet_plus_pretrained.pdparams \
    Train.dataset.data_dir=./dataset/table_rec_dataset_examples \
    Train.dataset.label_file_list='[./dataset/table_rec_dataset_examples/train.txt]' \
    Eval.dataset.data_dir=./dataset/table_rec_dataset_examples \
    Eval.dataset.label_file_list='[./dataset/table_rec_dataset_examples/val.txt]'

# 注意将pretrained_model的路径设置为本地路径。若使用自行训练保存的模型,请注意修改路径和文件名为{path/to/weights}/{model_name}。
 # demo 测试集评估
python paddlex/repo_manager/repos/PaddleOCR/tools/eval.py \
 	-c zhch/table_structure_recognition/SLANet_plus_paddleocr.yml \
 	-o Global.pretrained_model=./output/SLANet_plus/best_accuracy.pdparams \
    Eval.dataset.data_dir=./dataset/table_rec_dataset_examples \
    Eval.dataset.label_file_list='[./dataset/table_rec_dataset_examples/val.txt]'