赵小蒙 4b87a571bf config读写配置更新 před 1 rokem
..
cli 02d805ea9b 增加重构函数位置 před 1 rokem
dict2md ca7059e514 注释更新 před 1 rokem
filter d5dbed7325 目录重构 před 1 rokem
io 02d805ea9b 增加重构函数位置 před 1 rokem
layout d5dbed7325 目录重构 před 1 rokem
libs 4b87a571bf config读写配置更新 před 1 rokem
para d3c9cb84f8 分段部分log限定在debug模式下才能输出 před 1 rokem
post_proc 71a042d9fc footnote检测逻辑更新 před 1 rokem
pre_proc fc10772503 ocr_construct_page_component 位置移动 před 1 rokem
spark 02d805ea9b 增加重构函数位置 před 1 rokem
train_utils efed5faa53 feat: modify foot note bbox tmp před 1 rokem
__init__.py d5dbed7325 目录重构 před 1 rokem
pdf_parse_by_ocr.py 872cd73f4a pipeline重构 před 1 rokem
pdf_parse_by_txt.py f65be6e094 pdf_parse_by_model.py ---> pdf_parse_by_txt.py před 1 rokem
pdf_parse_for_train.py fc10772503 ocr_construct_page_component 位置移动 před 1 rokem
pipeline.py 34bde6d8ec classify后在jso根层级添加_pdf_type标识,同时取消对非文本类pdf的drop před 1 rokem
pipeline_ocr.py 4b8dbd7cfb ocr_pdf_intermediate_dict_to_markdown_with_para支持mm和nlp双模式 před 1 rokem
pipeline_txt.py 044bd0191b delete 无用字段 před 1 rokem