赵小蒙 60208b1ba0 fix draw_layout_bbox logic hai 1 ano
..
cli 60208b1ba0 fix draw_layout_bbox logic hai 1 ano
dict2md 81f73a3d9d 避免空para导致的error hai 1 ano
filter 1b9d65b3d3 1、Trace类的key增加前置下划线 hai 1 ano
layout d5dbed7325 目录重构 hai 1 ano
libs 60208b1ba0 fix draw_layout_bbox logic hai 1 ano
model c460be9196 模型数据初始化时根据置信度进行过滤,预设阈值95% hai 1 ano
para 778b1fb7b5 更新了para_split hai 1 ano
pipe 1340a97ae2 统一使用ocr组装markdown hai 1 ano
post_proc 1b9d65b3d3 1、Trace类的key增加前置下划线 hai 1 ano
pre_proc ce992f271e 有些ocr的text和block框差异过大,降低fill阈值到0.7 hai 1 ano
rw 698c4a83d2 修改pipe模块 hai 1 ano
spark 709a65008a 中间态dict结构调整 hai 1 ano
train_utils efed5faa53 feat: modify foot note bbox tmp hai 1 ano
__init__.py d5dbed7325 目录重构 hai 1 ano
pdf_parse_by_ocr.py e31066bae5 更新了para_split hai 1 ano
pdf_parse_by_ocr_v2.py fa6e305c12 v2pipeline在分段区域增加异常捕获 hai 1 ano
pdf_parse_by_txt.py d438b97a0a 切图逻辑重构 hai 1 ano
pdf_parse_by_txt_v2.py fa6e305c12 v2pipeline在分段区域增加异常捕获 hai 1 ano
pdf_parse_for_train.py d438b97a0a 切图逻辑重构 hai 1 ano
pipeline.bak 1b9d65b3d3 1、Trace类的key增加前置下划线 hai 1 ano
pipeline_ocr.bak 1b9d65b3d3 1、Trace类的key增加前置下划线 hai 1 ano
pipeline_txt.bak 1b9d65b3d3 1、Trace类的key增加前置下划线 hai 1 ano
user_api.py b16599cdf2 feat: update cli hai 1 ano