myhloli 052a4d72ed perf(magic_pdf): optimize batch ratio calculation for GPU před 10 měsíci
..
config 20438bd2b7 feat(language-detection): add YOLOv11 language detection model před 11 měsíci
data 3271cf75d3 refactor(langdetect): simplify language detection model and improve logging před 10 měsíci
dict2md 0a468eca6e feat(llm_aided): add title optimization feature před 11 měsíci
filter e1be7da644 refactor(magic_pdf): switch to pdfminer for invalid character detection před 11 měsíci
integrations b492c19c4c refactor: move some constants or enums defs to config folder před 1 rokem
libs 1a549a0e4b fix(language): remove invalid UTF-16 surrogate pairs from input text před 10 měsíci
model 052a4d72ed perf(magic_pdf): optimize batch ratio calculation for GPU před 10 měsíci
operators 52efe94da8 feat(api): simplify markdown and content list generation před 10 měsíci
post_proc d986e39313 feat(llm_aided): add reasonability check and fine-tuning guidelines před 10 měsíci
pre_proc f37b14bc83 refactor(pre_proc): adjust IOU threshold for character overlap detection před 10 měsíci
resources 2a3a006f4d fix(models): update unimernet_small model path před 10 měsíci
spark b492c19c4c refactor: move some constants or enums defs to config folder před 1 rokem
tools f911a102ab feat(tools): add character bounding box drawing functionality před 10 měsíci
utils f6af67eb11 feat: support convert ppt/pptx/doc/docx před 11 měsíci
__init__.py d5dbed7325 目录重构 před 1 rokem
pdf_parse_union_core_v2.py ba6c17a9d9 feat(pdf_parse): remove tilted lines for better text extraction před 10 měsíci