赵小蒙 e9aa103cae ocr增加分页markdown输出格式 1 ano atrás
..
dict2md e9aa103cae ocr增加分页markdown输出格式 1 ano atrás
filter d5dbed7325 目录重构 1 ano atrás
layout d5dbed7325 目录重构 1 ano atrás
libs ce96c3f67c 为ocr模式的demo增加online模式,pipeline进行微调适配online模式 1 ano atrás
para 8e3beebd1a 修复index越界错误 1 ano atrás
post_proc 71a042d9fc footnote检测逻辑更新 1 ano atrás
pre_proc 90ea9096e5 部分layout最底部的文本圈不全,降低阈值减少底边文本被丢弃的可能性 1 ano atrás
train_utils 4f1f7d62d5 feat: add layout 1 ano atrás
__init__.py d5dbed7325 目录重构 1 ano atrás
pdf_parse_by_model.py f68c66290c update code 1 ano atrás
pdf_parse_by_ocr.py a4a9fd6934 Merge remote-tracking branch 'origin/master' 1 ano atrás
pdf_parse_for_train.py 09269c845e feat: add extract_train_data 1 ano atrás
pipeline.py e9aa103cae ocr增加分页markdown输出格式 1 ano atrás