myhloli 9032185553 build(dependencies): update PyMuPDF, pydantic and transformers před 7 měsíci
..
config 20438bd2b7 feat(language-detection): add YOLOv11 language detection model před 11 měsíci
data adbf492111 fix: support auto method and auto lang před 7 měsíci
dict2md c46d3373de refactor(ocr_mkcontent): improve title level handling and formatting před 8 měsíci
filter a5342950f6 fix(filter): toggle invalid character detection method před 9 měsíci
integrations b492c19c4c refactor: move some constants or enums defs to config folder před 1 rokem
libs 978ef41cdd feat(performance_stats): improve function identification in execution time logging před 7 měsíci
model 9032185553 build(dependencies): update PyMuPDF, pydantic and transformers před 7 měsíci
operators 52efe94da8 feat(api): simplify markdown and content list generation před 10 měsíci
post_proc 842483ccb3 refactor(magic_pdf): improve paragraph splitting logic and update dependencies před 8 měsíci
pre_proc be505a958c fix(pre_proc): improve character overlap handling in OCR processing před 7 měsíci
resources c45a706ca8 refactor(model): update OCR model and remove unused configs před 7 měsíci
spark b492c19c4c refactor: move some constants or enums defs to config folder před 1 rokem
tools bbba2a120c feat: batch inference with ocr and lang flag před 7 měsíci
utils f6af67eb11 feat: support convert ppt/pptx/doc/docx před 11 měsíci
__init__.py d5dbed7325 目录重构 před 1 rokem
pdf_parse_union_core_v2.py a024c30fc4 feat(ocr): implement dynamic OCR processing for text spans with low contrast před 7 měsíci