| .. |
|
config
|
02b7999299
add init to magic_pdf.config
|
1 an în urmă |
|
data
|
338c681455
feat: add more unittest
|
1 an în urmă |
|
dict2md
|
bd75596219
fix(merge_text): add ligature replacement functionality
|
1 an în urmă |
|
filter
|
df14c61f6f
update: Enhance the capability to detect garbled document issues
|
1 an în urmă |
|
integrations
|
b72d4ebd94
Feat/support rag (#510)
|
1 an în urmă |
|
layout
|
03469909bb
Feat/support footnote in figure (#532)
|
1 an în urmă |
|
libs
|
699b589b23
Update version.py with new version
|
1 an în urmă |
|
model
|
4b0f11769d
refactor(model): remove unused code and simplify OCR model initialization
|
1 an în urmă |
|
para
|
cf0d76c094
feat(para_split_v3): improve list identification with block aspect ratio
|
1 an în urmă |
|
pipe
|
1279f2cd0f
feat(model): add support for DocLayout-YOLO model
|
1 an în urmă |
|
post_proc
|
1b9d65b3d3
1、Trace类的key增加前置下划线
|
1 an în urmă |
|
pre_proc
|
1807126e7f
refactor(ocr): adjust OCR processing parameters
|
1 an în urmă |
|
resources
|
1279f2cd0f
feat(model): add support for DocLayout-YOLO model
|
1 an în urmă |
|
rw
|
40e0827e60
Feat/impl cli (#264)
|
1 an în urmă |
|
spark
|
c9af3457f5
delete useless files
|
1 an în urmă |
|
tools
|
acab8de50f
docs: update model download instructions and simplify demo scripts
|
1 an în urmă |
|
utils
|
9cda7051c6
add init to magic_pdf.utils
|
1 an în urmă |
|
__init__.py
|
d5dbed7325
目录重构
|
1 an în urmă |
|
pdf_parse_by_ocr.py
|
283b597a6e
feat: add [figure | table] match [caption | footnote] match algorithm v2
|
1 an în urmă |
|
pdf_parse_by_txt.py
|
283b597a6e
feat: add [figure | table] match [caption | footnote] match algorithm v2
|
1 an în urmă |
|
pdf_parse_union_core.py
|
068fab7f81
fix(end_page_id):Fix the issue where end_page_id is corrected to len-1 when its input is 0. (#518)
|
1 an în urmă |
|
pdf_parse_union_core_v2.py
|
149132d608
feat(pdf_parse): improve span filtering and add new block types
|
1 an în urmă |
|
user_api.py
|
1279f2cd0f
feat(model): add support for DocLayout-YOLO model
|
1 an în urmă |