赵小蒙 61a0c62c46 pdf_info_dict中间态结构调整 1 年之前
..
dict2md ec1a6ef716 增加生成多模态markdown逻辑 1 年之前
filter d5dbed7325 目录重构 1 年之前
layout d5dbed7325 目录重构 1 年之前
libs 9cc53a5e57 更新清除重叠span的逻辑 1 年之前
para d5dbed7325 目录重构 1 年之前
post_proc 71a042d9fc footnote检测逻辑更新 1 年之前
pre_proc 61a0c62c46 pdf_info_dict中间态结构调整 1 年之前
__init__.py d5dbed7325 目录重构 1 年之前
pdf_parse_by_model.py 388223f2e0 ocr模式下删除header/page number/footnote/footer 1 年之前
pdf_parse_by_ocr.py 61a0c62c46 pdf_info_dict中间态结构调整 1 年之前
pipeline.py f7a7206e08 目录重构 1 年之前