赵小蒙 90ea9096e5 部分layout最底部的文本圈不全,降低阈值减少底边文本被丢弃的可能性 před 1 rokem
..
__init__.py d5dbed7325 目录重构 před 1 rokem
citationmarker_remove.py d5dbed7325 目录重构 před 1 rokem
construct_paras.py d5dbed7325 目录重构 před 1 rokem
detect_equation.py bc339320ab 增加了一个solve_line_alien.py,在detect_equation.py中修改了__solve_contain_bboxs函数,并在pdf_parse_by_model.py里增加了函数solve_line_alien.py的调用 před 1 rokem
detect_footer_by_model.py f62d1aa781 将模型和pymu坐标的转换逻辑抽象成方法 před 1 rokem
detect_footer_header_by_statistics.py d5dbed7325 目录重构 před 1 rokem
detect_footnote.py f62d1aa781 将模型和pymu坐标的转换逻辑抽象成方法 před 1 rokem
detect_header.py f62d1aa781 将模型和pymu坐标的转换逻辑抽象成方法 před 1 rokem
detect_images.py d5dbed7325 目录重构 před 1 rokem
detect_page_number.py f62d1aa781 将模型和pymu坐标的转换逻辑抽象成方法 před 1 rokem
detect_tables.py d5dbed7325 目录重构 před 1 rokem
equations_replace.py d5ea44f944 按照统一格式组合文本型pdf的解析结果 před 1 rokem
fix_image.py d5dbed7325 目录重构 před 1 rokem
fix_table.py d5dbed7325 目录重构 před 1 rokem
main_text_font.py d5dbed7325 目录重构 před 1 rokem
ocr_cut_image.py 8a2736a53f 截图增加s3上传逻辑,移除宽或高为0的spans před 1 rokem
ocr_detect_layout.py 6396910992 移动modify_y_axis在pipeline中的位置 před 1 rokem
ocr_dict_merge.py 90ea9096e5 部分layout最底部的文本圈不全,降低阈值减少底边文本被丢弃的可能性 před 1 rokem
ocr_span_list_modify.py 5eab010b98 ocr模式对所有drop的span记录tag并分类 před 1 rokem
pdf_pre_filter.py d5dbed7325 目录重构 před 1 rokem
post_layout_split.py d5dbed7325 目录重构 před 1 rokem
remove_bbox_overlap.py 2611e85349 feat: complete self check před 1 rokem
remove_colored_strip_bbox.py d5dbed7325 目录重构 před 1 rokem
remove_footer_header.py d5ea44f944 按照统一格式组合文本型pdf的解析结果 před 1 rokem
remove_rotate_bbox.py d5ea44f944 按照统一格式组合文本型pdf的解析结果 před 1 rokem
resolve_bbox_conflict.py d5ea44f944 按照统一格式组合文本型pdf的解析结果 před 1 rokem
solve_line_alien.py bc339320ab 增加了一个solve_line_alien.py,在detect_equation.py中修改了__solve_contain_bboxs函数,并在pdf_parse_by_model.py里增加了函数solve_line_alien.py的调用 před 1 rokem
statistics.py d5dbed7325 目录重构 před 1 rokem