赵小蒙 4b87a571bf config读写配置更新 hai 1 ano
..
cli 02d805ea9b 增加重构函数位置 hai 1 ano
dict2md ca7059e514 注释更新 hai 1 ano
filter d5dbed7325 目录重构 hai 1 ano
io 02d805ea9b 增加重构函数位置 hai 1 ano
layout d5dbed7325 目录重构 hai 1 ano
libs 4b87a571bf config读写配置更新 hai 1 ano
para d3c9cb84f8 分段部分log限定在debug模式下才能输出 hai 1 ano
post_proc 71a042d9fc footnote检测逻辑更新 hai 1 ano
pre_proc fc10772503 ocr_construct_page_component 位置移动 hai 1 ano
spark 02d805ea9b 增加重构函数位置 hai 1 ano
train_utils efed5faa53 feat: modify foot note bbox tmp hai 1 ano
__init__.py d5dbed7325 目录重构 hai 1 ano
pdf_parse_by_ocr.py 872cd73f4a pipeline重构 hai 1 ano
pdf_parse_by_txt.py f65be6e094 pdf_parse_by_model.py ---> pdf_parse_by_txt.py hai 1 ano
pdf_parse_for_train.py fc10772503 ocr_construct_page_component 位置移动 hai 1 ano
pipeline.py 34bde6d8ec classify后在jso根层级添加_pdf_type标识,同时取消对非文本类pdf的drop hai 1 ano
pipeline_ocr.py 4b8dbd7cfb ocr_pdf_intermediate_dict_to_markdown_with_para支持mm和nlp双模式 hai 1 ano
pipeline_txt.py 044bd0191b delete 无用字段 hai 1 ano