table_recognition_v2-说明.md 2.1 KB

交易流水,单栏列表,有线表格

使用table_recognition_v2产线,关键参数use_wired_table_cells_trans_to_html: use_wired_table_cells_trans_to_html:启用有线表单元格直转HTML模式,启用时直接基于有线表单元格检测模型预测的各单元格位置排布与几何关系构建HTML结构。此模式在不同场景下效果不同,请根据实际情况选择。一般来说,建议在有线表单元格检测非常准确的场景下开启此模式,以获得更加准确的端到端表格识别结果。

执行脚本

# A用户_单元格扫描流水
python table_recognition_v2_single_process.py \
    --input_dir "/Users/zhch158/workspace/data/流水分析/A用户_单元格扫描流水.img" \
    --output_dir "/Users/zhch158/workspace/data/流水分析/A用户_单元格扫描流水/table_recognition_v2_Results" \
    --pipeline "./my_config/table_recognition_v2.yaml" \
    --device "cpu"

# 至远彩色印刷工业有限公司_2023年度报告母公司
python table_recognition_v2_single_process.py \
    --input_dir "/Users/zhch158/workspace/data/至远彩色印刷工业有限公司/2023年度报告母公司.img" \
    --output_dir "/Users/zhch158/workspace/data/至远彩色印刷工业有限公司/table_recognition_v2_Results" \
    --pipeline "./my_config/table_recognition_v2.yaml" \
    --device "cpu"

# 德_内蒙古银行照.pdf
python table_recognition_v2_single_process.py \
    --input_file "/Users/zhch158/workspace/data/流水分析/德_内蒙古银行照.pdf" \
    --output_dir "/Users/zhch158/workspace/data/流水分析/德_内蒙古银行照/table_recognition_v2_Results" \
    --pipeline "./my_config/table_recognition_v2.yaml" \
    --device "cpu"

# 对公_招商银行图.pdf 无线表格
python table_recognition_v2_single_process.py \
    --input_file "/Users/zhch158/workspace/data/流水分析/对公_招商银行图.pdf" \
    --output_dir "/Users/zhch158/workspace/data/流水分析/对公_招商银行图/table_recognition_v2_Results" \
    --pipeline "./my_config/table_recognition_v2.yaml" \
    --device "cpu"
    # --no-adapter \