icecraft 6a481320ea fix: using new data api replace old rw api 1 år sedan
..
config 02b7999299 add init to magic_pdf.config 1 år sedan
data 338c681455 feat: add more unittest 1 år sedan
dict2md 2de1d0ef05 fix(ocr_mkcontent): improve handling of single-character content 1 år sedan
filter df14c61f6f update: Enhance the capability to detect garbled document issues 1 år sedan
integrations 6a481320ea fix: using new data api replace old rw api 1 år sedan
layout 03469909bb Feat/support footnote in figure (#532) 1 år sedan
libs 6a481320ea fix: using new data api replace old rw api 1 år sedan
model 6a481320ea fix: using new data api replace old rw api 1 år sedan
para 220a24cd4c 更新 para_split_v3.py 1 år sedan
pipe 6a481320ea fix: using new data api replace old rw api 1 år sedan
post_proc 1b9d65b3d3 1、Trace类的key增加前置下划线 1 år sedan
pre_proc 1807126e7f refactor(ocr): adjust OCR processing parameters 1 år sedan
resources 240fe99e3c feat(table): integrate RapidTable model for table recognition 1 år sedan
rw 40e0827e60 Feat/impl cli (#264) 1 år sedan
spark c9af3457f5 delete useless files 1 år sedan
tools 6a481320ea fix: using new data api replace old rw api 1 år sedan
utils 9cda7051c6 add init to magic_pdf.utils 1 år sedan
__init__.py d5dbed7325 目录重构 1 år sedan
pdf_parse_by_ocr.py 283b597a6e feat: add [figure | table] match [caption | footnote] match algorithm v2 1 år sedan
pdf_parse_by_txt.py 283b597a6e feat: add [figure | table] match [caption | footnote] match algorithm v2 1 år sedan
pdf_parse_union_core.py 068fab7f81 fix(end_page_id):Fix the issue where end_page_id is corrected to len-1 when its input is 0. (#518) 1 år sedan
pdf_parse_union_core_v2.py 08f46125a0 refactor(model): rename and restructure model modules 1 år sedan
user_api.py 6a481320ea fix: using new data api replace old rw api 1 år sedan