赵小蒙 60208b1ba0 fix draw_layout_bbox logic 1 năm trước cách đây
..
cli 60208b1ba0 fix draw_layout_bbox logic 1 năm trước cách đây
dict2md 81f73a3d9d 避免空para导致的error 1 năm trước cách đây
filter 1b9d65b3d3 1、Trace类的key增加前置下划线 1 năm trước cách đây
layout d5dbed7325 目录重构 1 năm trước cách đây
libs 60208b1ba0 fix draw_layout_bbox logic 1 năm trước cách đây
model c460be9196 模型数据初始化时根据置信度进行过滤,预设阈值95% 1 năm trước cách đây
para 778b1fb7b5 更新了para_split 1 năm trước cách đây
pipe 1340a97ae2 统一使用ocr组装markdown 1 năm trước cách đây
post_proc 1b9d65b3d3 1、Trace类的key增加前置下划线 1 năm trước cách đây
pre_proc ce992f271e 有些ocr的text和block框差异过大,降低fill阈值到0.7 1 năm trước cách đây
rw 698c4a83d2 修改pipe模块 1 năm trước cách đây
spark 709a65008a 中间态dict结构调整 1 năm trước cách đây
train_utils efed5faa53 feat: modify foot note bbox tmp 1 năm trước cách đây
__init__.py d5dbed7325 目录重构 1 năm trước cách đây
pdf_parse_by_ocr.py e31066bae5 更新了para_split 1 năm trước cách đây
pdf_parse_by_ocr_v2.py fa6e305c12 v2pipeline在分段区域增加异常捕获 1 năm trước cách đây
pdf_parse_by_txt.py d438b97a0a 切图逻辑重构 1 năm trước cách đây
pdf_parse_by_txt_v2.py fa6e305c12 v2pipeline在分段区域增加异常捕获 1 năm trước cách đây
pdf_parse_for_train.py d438b97a0a 切图逻辑重构 1 năm trước cách đây
pipeline.bak 1b9d65b3d3 1、Trace类的key增加前置下划线 1 năm trước cách đây
pipeline_ocr.bak 1b9d65b3d3 1、Trace类的key增加前置下划线 1 năm trước cách đây
pipeline_txt.bak 1b9d65b3d3 1、Trace类的key增加前置下划线 1 năm trước cách đây
user_api.py b16599cdf2 feat: update cli 1 năm trước cách đây