| .. |
|
__init__.py
|
d5dbed7325
目录重构
|
il y a 1 an |
|
citationmarker_remove.py
|
d5dbed7325
目录重构
|
il y a 1 an |
|
construct_page_dict.py
|
fc10772503
ocr_construct_page_component 位置移动
|
il y a 1 an |
|
detect_equation.py
|
bc339320ab
增加了一个solve_line_alien.py,在detect_equation.py中修改了__solve_contain_bboxs函数,并在pdf_parse_by_model.py里增加了函数solve_line_alien.py的调用
|
il y a 1 an |
|
detect_footer_by_model.py
|
f62d1aa781
将模型和pymu坐标的转换逻辑抽象成方法
|
il y a 1 an |
|
detect_footer_header_by_statistics.py
|
d5dbed7325
目录重构
|
il y a 1 an |
|
detect_footnote.py
|
0e2d0b8b4f
parse_pdf_by_ocr 和 cut_image 重构,使用抽象类进行写出操作
|
il y a 1 an |
|
detect_header.py
|
f62d1aa781
将模型和pymu坐标的转换逻辑抽象成方法
|
il y a 1 an |
|
detect_images.py
|
d5dbed7325
目录重构
|
il y a 1 an |
|
detect_page_number.py
|
f62d1aa781
将模型和pymu坐标的转换逻辑抽象成方法
|
il y a 1 an |
|
detect_tables.py
|
d5dbed7325
目录重构
|
il y a 1 an |
|
equations_replace.py
|
d5ea44f944
按照统一格式组合文本型pdf的解析结果
|
il y a 1 an |
|
fix_image.py
|
d5dbed7325
目录重构
|
il y a 1 an |
|
fix_table.py
|
d5dbed7325
目录重构
|
il y a 1 an |
|
main_text_font.py
|
d5dbed7325
目录重构
|
il y a 1 an |
|
ocr_cut_image.py
|
0e2d0b8b4f
parse_pdf_by_ocr 和 cut_image 重构,使用抽象类进行写出操作
|
il y a 1 an |
|
ocr_detect_layout.py
|
6396910992
移动modify_y_axis在pipeline中的位置
|
il y a 1 an |
|
ocr_dict_merge.py
|
90ea9096e5
部分layout最底部的文本圈不全,降低阈值减少底边文本被丢弃的可能性
|
il y a 1 an |
|
ocr_span_list_modify.py
|
154eed1ade
footnote drop逻辑更新
|
il y a 1 an |
|
pdf_pre_filter.py
|
1b9d65b3d3
1、Trace类的key增加前置下划线
|
il y a 1 an |
|
post_layout_split.py
|
d5dbed7325
目录重构
|
il y a 1 an |
|
remove_bbox_overlap.py
|
2611e85349
feat: complete self check
|
il y a 1 an |
|
remove_colored_strip_bbox.py
|
d5dbed7325
目录重构
|
il y a 1 an |
|
remove_footer_header.py
|
d5ea44f944
按照统一格式组合文本型pdf的解析结果
|
il y a 1 an |
|
remove_rotate_bbox.py
|
d5ea44f944
按照统一格式组合文本型pdf的解析结果
|
il y a 1 an |
|
resolve_bbox_conflict.py
|
d5ea44f944
按照统一格式组合文本型pdf的解析结果
|
il y a 1 an |
|
solve_line_alien.py
|
bc339320ab
增加了一个solve_line_alien.py,在detect_equation.py中修改了__solve_contain_bboxs函数,并在pdf_parse_by_model.py里增加了函数solve_line_alien.py的调用
|
il y a 1 an |
|
statistics.py
|
d5dbed7325
目录重构
|
il y a 1 an |