赵小蒙 4b87a571bf config读写配置更新 hace 1 año
..
cli 02d805ea9b 增加重构函数位置 hace 1 año
dict2md ca7059e514 注释更新 hace 1 año
filter d5dbed7325 目录重构 hace 1 año
io 02d805ea9b 增加重构函数位置 hace 1 año
layout d5dbed7325 目录重构 hace 1 año
libs 4b87a571bf config读写配置更新 hace 1 año
para d3c9cb84f8 分段部分log限定在debug模式下才能输出 hace 1 año
post_proc 71a042d9fc footnote检测逻辑更新 hace 1 año
pre_proc fc10772503 ocr_construct_page_component 位置移动 hace 1 año
spark 02d805ea9b 增加重构函数位置 hace 1 año
train_utils efed5faa53 feat: modify foot note bbox tmp hace 1 año
__init__.py d5dbed7325 目录重构 hace 1 año
pdf_parse_by_ocr.py 872cd73f4a pipeline重构 hace 1 año
pdf_parse_by_txt.py f65be6e094 pdf_parse_by_model.py ---> pdf_parse_by_txt.py hace 1 año
pdf_parse_for_train.py fc10772503 ocr_construct_page_component 位置移动 hace 1 año
pipeline.py 34bde6d8ec classify后在jso根层级添加_pdf_type标识,同时取消对非文本类pdf的drop hace 1 año
pipeline_ocr.py 4b8dbd7cfb ocr_pdf_intermediate_dict_to_markdown_with_para支持mm和nlp双模式 hace 1 año
pipeline_txt.py 044bd0191b delete 无用字段 hace 1 año