赵小蒙 81f73a3d9d 避免空para导致的error hai 1 ano
..
cli ef0129adf0 修改pdf的路径 hai 1 ano
dict2md 81f73a3d9d 避免空para导致的error hai 1 ano
filter 1b9d65b3d3 1、Trace类的key增加前置下划线 hai 1 ano
layout d5dbed7325 目录重构 hai 1 ano
libs ebc2f057ef fix: remove_overlap leading zero height case hai 1 ano
model 83641d3d97 文本框与标题框重叠,优先信任文本框 hai 1 ano
para 9528a839c8 更新了para_split hai 1 ano
pipe 1340a97ae2 统一使用ocr组装markdown hai 1 ano
post_proc 1b9d65b3d3 1、Trace类的key增加前置下划线 hai 1 ano
pre_proc f6d8f6cab5 Merge pull request #48 from icecraft/feat/fix_zero_height hai 1 ano
rw 698c4a83d2 修改pipe模块 hai 1 ano
spark 709a65008a 中间态dict结构调整 hai 1 ano
train_utils efed5faa53 feat: modify foot note bbox tmp hai 1 ano
__init__.py d5dbed7325 目录重构 hai 1 ano
pdf_parse_by_ocr.py e31066bae5 更新了para_split hai 1 ano
pdf_parse_by_ocr_v2.py d7128a9d87 更新mm markdown拼装函数 hai 1 ano
pdf_parse_by_txt.py d438b97a0a 切图逻辑重构 hai 1 ano
pdf_parse_by_txt_v2.py ebc2f057ef fix: remove_overlap leading zero height case hai 1 ano
pdf_parse_for_train.py d438b97a0a 切图逻辑重构 hai 1 ano
pipeline.bak 1b9d65b3d3 1、Trace类的key增加前置下划线 hai 1 ano
pipeline_ocr.bak 1b9d65b3d3 1、Trace类的key增加前置下划线 hai 1 ano
pipeline_txt.bak 1b9d65b3d3 1、Trace类的key增加前置下划线 hai 1 ano
user_api.py b16599cdf2 feat: update cli hai 1 ano