赵小蒙 7f0c734ff6 pipeline重构 1 jaar geleden
..
dict2md b7652171ea make_standard_format_with_para逻辑更新 1 jaar geleden
filter d5dbed7325 目录重构 1 jaar geleden
layout d5dbed7325 目录重构 1 jaar geleden
libs f36c26565e 使用面积占比方式判断一行文本是不是在一个layoutbox里 1 jaar geleden
para d3c9cb84f8 分段部分log限定在debug模式下才能输出 1 jaar geleden
post_proc 71a042d9fc footnote检测逻辑更新 1 jaar geleden
pre_proc fc10772503 ocr_construct_page_component 位置移动 1 jaar geleden
spark 7162debc38 实现文本拼PDF解析结果装标准格式 1 jaar geleden
train_utils efed5faa53 feat: modify foot note bbox tmp 1 jaar geleden
__init__.py d5dbed7325 目录重构 1 jaar geleden
pdf_parse_by_model.py 7f0c734ff6 pipeline重构 1 jaar geleden
pdf_parse_by_ocr.py 872cd73f4a pipeline重构 1 jaar geleden
pdf_parse_for_train.py fc10772503 ocr_construct_page_component 位置移动 1 jaar geleden
pipeline.py 7f0c734ff6 pipeline重构 1 jaar geleden
pipeline_ocr.py 872cd73f4a pipeline重构 1 jaar geleden
pipeline_txt.py 433684c646 实现多模态markdown拼装 1 jaar geleden