赵小蒙 e92de75844 add todo about interline_equation преди 1 година
..
__init__.py d5dbed7325 目录重构 преди 1 година
citationmarker_remove.py a3dc2cba64 remove spacy dependence преди 1 година
construct_page_dict.py 442f36845f fix complicated layout logic преди 1 година
cut_image.py c5b27057ea 切图逻辑修复 преди 1 година
detect_equation.py bc339320ab 增加了一个solve_line_alien.py,在detect_equation.py中修改了__solve_contain_bboxs函数,并在pdf_parse_by_model.py里增加了函数solve_line_alien.py的调用 преди 1 година
detect_footer_by_model.py f62d1aa781 将模型和pymu坐标的转换逻辑抽象成方法 преди 1 година
detect_footer_header_by_statistics.py d5dbed7325 目录重构 преди 1 година
detect_footnote.py 0e2d0b8b4f parse_pdf_by_ocr 和 cut_image 重构,使用抽象类进行写出操作 преди 1 година
detect_header.py f62d1aa781 将模型和pymu坐标的转换逻辑抽象成方法 преди 1 година
detect_images.py d5dbed7325 目录重构 преди 1 година
detect_page_number.py f62d1aa781 将模型和pymu坐标的转换逻辑抽象成方法 преди 1 година
detect_tables.py d5dbed7325 目录重构 преди 1 година
equations_replace.py 3c145ba0ca fix: some text char removed by interline_equations overlap преди 1 година
fix_image.py d5dbed7325 目录重构 преди 1 година
fix_table.py d5dbed7325 目录重构 преди 1 година
main_text_font.py d5dbed7325 目录重构 преди 1 година
ocr_detect_all_bboxes.py e92de75844 add todo about interline_equation преди 1 година
ocr_detect_layout.py 6396910992 移动modify_y_axis在pipeline中的位置 преди 1 година
ocr_dict_merge.py 3c145ba0ca fix: some text char removed by interline_equations overlap преди 1 година
ocr_span_list_modify.py e590729669 fix span overlap by confidence,remove duplicate spans преди 1 година
pdf_pre_filter.py 1b9d65b3d3 1、Trace类的key增加前置下划线 преди 1 година
post_layout_split.py d5dbed7325 目录重构 преди 1 година
remove_bbox_overlap.py d59981499d fix: error return typo преди 1 година
remove_colored_strip_bbox.py d5dbed7325 目录重构 преди 1 година
remove_footer_header.py d5ea44f944 按照统一格式组合文本型pdf的解析结果 преди 1 година
remove_rotate_bbox.py d5ea44f944 按照统一格式组合文本型pdf的解析结果 преди 1 година
resolve_bbox_conflict.py deb98fd0b1 fix footnote overlap error преди 1 година
solve_line_alien.py bc339320ab 增加了一个solve_line_alien.py,在detect_equation.py中修改了__solve_contain_bboxs函数,并在pdf_parse_by_model.py里增加了函数solve_line_alien.py的调用 преди 1 година
statistics.py d5dbed7325 目录重构 преди 1 година