icecraft e155d32212 feat: remove dummpy code, magic_pdf/cli, magic_pdf/train_utils (#291) 1 年間 前
..
dict2md a5c35165ee feat(dict2md): add page index to para content for standard format v2 1 年間 前
filter df14c61f6f update: Enhance the capability to detect garbled document issues 1 年間 前
layout d5dbed7325 目录重构 1 年間 前
libs 40e0827e60 Feat/impl cli (#264) 1 年間 前
model 5be6ee8fce fix(magic_pdf): add warning for Lite model usage in doc analysis 1 年間 前
para 7dcf63e69c fix:close some log output if not in debug mode 1 年間 前
pipe f8f6ba6fd3 update:Add md make mode config in do_parse.You can control whether the produced md is for NLP or MM by changing the value of f_make_md_mode 1 年間 前
post_proc 1b9d65b3d3 1、Trace类的key增加前置下划线 1 年間 前
pre_proc e831df807a fix(magic_pdf): use interline_equations instead of interline_equation_blocks 1 年間 前
resources 57380cbed5 feat(language): add FT LANG cache directory setup 1 年間 前
rw 40e0827e60 Feat/impl cli (#264) 1 年間 前
spark c9af3457f5 delete useless files 1 年間 前
tools e155d32212 feat: remove dummpy code, magic_pdf/cli, magic_pdf/train_utils (#291) 1 年間 前
__init__.py d5dbed7325 目录重构 1 年間 前
pdf_parse_by_ocr.py 959b8d82d8 renamed pipeline file name 1 年間 前
pdf_parse_by_txt.py 959b8d82d8 renamed pipeline file name 1 年間 前
pdf_parse_union_core.py e831df807a fix(magic_pdf): use interline_equations instead of interline_equation_blocks 1 年間 前
user_api.py 959b8d82d8 renamed pipeline file name 1 年間 前