赵小蒙 72b7894c70 模型输出的layout顺序没有排序,需要后期排序 1 år sedan
..
__init__.py d5dbed7325 目录重构 1 år sedan
citationmarker_remove.py d5dbed7325 目录重构 1 år sedan
construct_paras.py d5dbed7325 目录重构 1 år sedan
detect_equation.py bc339320ab 增加了一个solve_line_alien.py,在detect_equation.py中修改了__solve_contain_bboxs函数,并在pdf_parse_by_model.py里增加了函数solve_line_alien.py的调用 1 år sedan
detect_footer_by_model.py f62d1aa781 将模型和pymu坐标的转换逻辑抽象成方法 1 år sedan
detect_footer_header_by_statistics.py d5dbed7325 目录重构 1 år sedan
detect_footnote.py f62d1aa781 将模型和pymu坐标的转换逻辑抽象成方法 1 år sedan
detect_header.py f62d1aa781 将模型和pymu坐标的转换逻辑抽象成方法 1 år sedan
detect_images.py d5dbed7325 目录重构 1 år sedan
detect_page_number.py f62d1aa781 将模型和pymu坐标的转换逻辑抽象成方法 1 år sedan
detect_tables.py d5dbed7325 目录重构 1 år sedan
equations_replace.py d5dbed7325 目录重构 1 år sedan
fix_image.py d5dbed7325 目录重构 1 år sedan
fix_table.py d5dbed7325 目录重构 1 år sedan
main_text_font.py d5dbed7325 目录重构 1 år sedan
ocr_cut_image.py a5f8de9882 ocr模式增加截图功能 1 år sedan
ocr_detect_layout.py 72b7894c70 模型输出的layout顺序没有排序,需要后期排序 1 år sedan
ocr_dict_merge.py 012a8f1567 修复多栏模式下lines可能为空导致的异常 1 år sedan
ocr_remove_spans.py 0c279ffccd 更新remove_spans_by_bboxes中选择被删除的span的逻辑 1 år sedan
pdf_pre_filter.py d5dbed7325 目录重构 1 år sedan
post_layout_split.py d5dbed7325 目录重构 1 år sedan
remove_colored_strip_bbox.py d5dbed7325 目录重构 1 år sedan
remove_footer_header.py d5dbed7325 目录重构 1 år sedan
remove_rotate_bbox.py d5dbed7325 目录重构 1 år sedan
resolve_bbox_conflict.py d5dbed7325 目录重构 1 år sedan
solve_line_alien.py bc339320ab 增加了一个solve_line_alien.py,在detect_equation.py中修改了__solve_contain_bboxs函数,并在pdf_parse_by_model.py里增加了函数solve_line_alien.py的调用 1 år sedan
statistics.py d5dbed7325 目录重构 1 år sedan