myhloli 244b868443 fix(split_v3): Fix the rule adaptation for some special list samples. hace 1 año
..
dict2md 1f1dd3538d feat(list&index block): detect and merge list and index blocks hace 1 año
filter df14c61f6f update: Enhance the capability to detect garbled document issues hace 1 año
integrations b72d4ebd94 Feat/support rag (#510) hace 1 año
layout 03469909bb Feat/support footnote in figure (#532) hace 1 año
libs 0a9a6d3e53 fix(magic_pdf): include List and Index block types in processing hace 1 año
model 1f1dd3538d feat(list&index block): detect and merge list and index blocks hace 1 año
para 244b868443 fix(split_v3): Fix the rule adaptation for some special list samples. hace 1 año
pipe 23b621e05a feat(UNIPipe): change default drop_mode to NONE_WITH_REASON hace 1 año
post_proc 1b9d65b3d3 1、Trace类的key增加前置下划线 hace 1 año
pre_proc 1f1dd3538d feat(list&index block): detect and merge list and index blocks hace 1 año
resources f2a3a49541 fix(pdf_extract_kit):change unimernet base -> small hace 1 año
rw 40e0827e60 Feat/impl cli (#264) hace 1 año
spark c9af3457f5 delete useless files hace 1 año
tools b2790f6f45 refactor(drawing): simplify draw bbox functions and adjust debug config hace 1 año
__init__.py d5dbed7325 目录重构 hace 1 año
pdf_parse_by_ocr.py 1efebe421c refactor(pdf_parse_union): integrate LayoutLMv3 for block orderingReplace the heuristic-based block ordering algorithm with LayoutLMv3 model predictions toimprove the accuracy of block ordering on PDF pages. Additionally, refactor the span hace 1 año
pdf_parse_by_txt.py 1efebe421c refactor(pdf_parse_union): integrate LayoutLMv3 for block orderingReplace the heuristic-based block ordering algorithm with LayoutLMv3 model predictions toimprove the accuracy of block ordering on PDF pages. Additionally, refactor the span hace 1 año
pdf_parse_union_core.py 068fab7f81 fix(end_page_id):Fix the issue where end_page_id is corrected to len-1 when its input is 0. (#518) hace 1 año
pdf_parse_union_core_v2.py 7e301b849b refactor(pdf): adjust span filling threshold in block construction hace 1 año
user_api.py 6062862c96 feat(pipeline): pass language parameter for parsing and markdown conversion hace 1 año