赵小蒙 a5f8de9882 ocr模式增加截图功能 1 рік тому
..
dict2md 00f3e329d9 修复一个span可能没有content导致的问题 1 рік тому
filter d5dbed7325 目录重构 1 рік тому
layout d5dbed7325 目录重构 1 рік тому
libs 0c279ffccd 更新remove_spans_by_bboxes中选择被删除的span的逻辑 1 рік тому
para d5dbed7325 目录重构 1 рік тому
post_proc 71a042d9fc footnote检测逻辑更新 1 рік тому
pre_proc a5f8de9882 ocr模式增加截图功能 1 рік тому
__init__.py d5dbed7325 目录重构 1 рік тому
pdf_parse_by_model.py 388223f2e0 ocr模式下删除header/page number/footnote/footer 1 рік тому
pdf_parse_by_ocr.py a5f8de9882 ocr模式增加截图功能 1 рік тому
pipeline.py f7a7206e08 目录重构 1 рік тому