xuchao 7f0af412bc 增加layout之间段落连接规则 hai 1 ano
..
dict2md 83753cbd77 元素类型引用统一定义 hai 1 ano
filter d5dbed7325 目录重构 hai 1 ano
layout d5dbed7325 目录重构 hai 1 ano
libs 143f8114bc Merge remote-tracking branch 'origin/master' hai 1 ano
para 7f0af412bc 增加layout之间段落连接规则 hai 1 ano
post_proc 71a042d9fc footnote检测逻辑更新 hai 1 ano
pre_proc 143f8114bc Merge remote-tracking branch 'origin/master' hai 1 ano
__init__.py d5dbed7325 目录重构 hai 1 ano
pdf_parse_by_model.py f68c66290c update code hai 1 ano
pdf_parse_by_ocr.py 5eab010b98 ocr模式对所有drop的span记录tag并分类 hai 1 ano
pipeline.py f5b9cff4c4 ocr后不需要再次检测need_drop,且ocr_dropped_parse_pdf逻辑后需要将need_drop置为false hai 1 ano