赵小蒙 72b7894c70 模型输出的layout顺序没有排序,需要后期排序 hai 1 ano
..
dict2md 00f3e329d9 修复一个span可能没有content导致的问题 hai 1 ano
filter d5dbed7325 目录重构 hai 1 ano
layout d5dbed7325 目录重构 hai 1 ano
libs 0c279ffccd 更新remove_spans_by_bboxes中选择被删除的span的逻辑 hai 1 ano
para d5dbed7325 目录重构 hai 1 ano
post_proc 71a042d9fc footnote检测逻辑更新 hai 1 ano
pre_proc 72b7894c70 模型输出的layout顺序没有排序,需要后期排序 hai 1 ano
__init__.py d5dbed7325 目录重构 hai 1 ano
pdf_parse_by_model.py 388223f2e0 ocr模式下删除header/page number/footnote/footer hai 1 ano
pdf_parse_by_ocr.py a5f8de9882 ocr模式增加截图功能 hai 1 ano
pipeline.py f7a7206e08 目录重构 hai 1 ano