myhloli 1e73b9fca0 fix: fasttext not support numpy>=2.0.0 пре 1 година
..
cli 8e149f381d fix: The presence of ".pdf" multiple times in the pdf_path results in model_path not matching the expected. пре 1 година
dict2md 5de013e6d5 fix:use line_lang instead of content_lang to concatenate para пре 1 година
filter df14c61f6f update: Enhance the capability to detect garbled document issues пре 1 година
layout d5dbed7325 目录重构 пре 1 година
libs 1e73b9fca0 fix: fasttext not support numpy>=2.0.0 пре 1 година
model 53ccd5a688 fix: add try import opencv-python and Pillow пре 1 година
para 7dcf63e69c fix:close some log output if not in debug mode пре 1 година
pipe df14c61f6f update: Enhance the capability to detect garbled document issues пре 1 година
post_proc 1b9d65b3d3 1、Trace类的key增加前置下划线 пре 1 година
pre_proc 7dcf63e69c fix:close some log output if not in debug mode пре 1 година
rw 5db8911daa add errors="replace" in write mode MODE_TXT пре 1 година
spark c9af3457f5 delete useless files пре 1 година
train_utils efed5faa53 feat: modify foot note bbox tmp пре 1 година
__init__.py d5dbed7325 目录重构 пре 1 година
pdf_parse_by_ocr.py 959b8d82d8 renamed pipeline file name пре 1 година
pdf_parse_by_txt.py 959b8d82d8 renamed pipeline file name пре 1 година
pdf_parse_for_train.py d438b97a0a 切图逻辑重构 пре 1 година
pdf_parse_union_core.py e92de75844 add todo about interline_equation пре 1 година
user_api.py 959b8d82d8 renamed pipeline file name пре 1 година