| .. |
|
cli
|
49076f02f3
fix draw_span_bbox logic
|
1 жил өмнө |
|
dict2md
|
81f73a3d9d
避免空para导致的error
|
1 жил өмнө |
|
filter
|
1b9d65b3d3
1、Trace类的key增加前置下划线
|
1 жил өмнө |
|
layout
|
d5dbed7325
目录重构
|
1 жил өмнө |
|
libs
|
49076f02f3
fix draw_span_bbox logic
|
1 жил өмнө |
|
model
|
c460be9196
模型数据初始化时根据置信度进行过滤,预设阈值95%
|
1 жил өмнө |
|
para
|
778b1fb7b5
更新了para_split
|
1 жил өмнө |
|
pipe
|
1340a97ae2
统一使用ocr组装markdown
|
1 жил өмнө |
|
post_proc
|
1b9d65b3d3
1、Trace类的key增加前置下划线
|
1 жил өмнө |
|
pre_proc
|
ce992f271e
有些ocr的text和block框差异过大,降低fill阈值到0.7
|
1 жил өмнө |
|
rw
|
698c4a83d2
修改pipe模块
|
1 жил өмнө |
|
spark
|
709a65008a
中间态dict结构调整
|
1 жил өмнө |
|
train_utils
|
efed5faa53
feat: modify foot note bbox tmp
|
1 жил өмнө |
|
__init__.py
|
d5dbed7325
目录重构
|
1 жил өмнө |
|
pdf_parse_by_ocr.py
|
e31066bae5
更新了para_split
|
1 жил өмнө |
|
pdf_parse_by_ocr_v2.py
|
fa6e305c12
v2pipeline在分段区域增加异常捕获
|
1 жил өмнө |
|
pdf_parse_by_txt.py
|
d438b97a0a
切图逻辑重构
|
1 жил өмнө |
|
pdf_parse_by_txt_v2.py
|
fa6e305c12
v2pipeline在分段区域增加异常捕获
|
1 жил өмнө |
|
pdf_parse_for_train.py
|
d438b97a0a
切图逻辑重构
|
1 жил өмнө |
|
pipeline.bak
|
1b9d65b3d3
1、Trace类的key增加前置下划线
|
1 жил өмнө |
|
pipeline_ocr.bak
|
1b9d65b3d3
1、Trace类的key增加前置下划线
|
1 жил өмнө |
|
pipeline_txt.bak
|
1b9d65b3d3
1、Trace类的key增加前置下划线
|
1 жил өмнө |
|
user_api.py
|
b16599cdf2
feat: update cli
|
1 жил өмнө |