赵小蒙
|
a4a9fd6934
Merge remote-tracking branch 'origin/master'
|
1 år sedan |
赵小蒙
|
ce96c3f67c
为ocr模式的demo增加online模式,pipeline进行微调适配online模式
|
1 år sedan |
xuchao
|
acabae5624
实现页面与页面之间段落的合并
|
1 år sedan |
赵小蒙
|
5eab010b98
ocr模式对所有drop的span记录tag并分类
|
1 år sedan |
xuchao
|
084e9328d0
实现layout内部分段
|
1 år sedan |
赵小蒙
|
8a2736a53f
截图增加s3上传逻辑,移除宽或高为0的spans
|
1 år sedan |
赵小蒙
|
0b35b73c64
删除高度或者宽度为0的spans
|
1 år sedan |
赵小蒙
|
26c2378271
ocr模式下content type 抽象
|
1 år sedan |
赵小蒙
|
b6f051d88f
在layout.pdf中绘制drop的bbox
|
1 år sedan |
赵小蒙
|
85587b257b
在dict中加入qa需要的字段
|
1 år sedan |
liukaiwen
|
64d67b5c58
add modify inline equation y axis
|
1 år sedan |
liukaiwen
|
f5dc261da5
Merge branch 'master' into dev-in-line-bbox
|
1 år sedan |
liukaiwen
|
1f468bed0a
add modify inline equation y axis
|
1 år sedan |
赵小蒙
|
32fd7f958c
将对span的操作移动到ocr_span_list_modify,增加独占一行区块的位置调整逻辑
|
1 år sedan |
赵小蒙
|
6396910992
移动modify_y_axis在pipeline中的位置
|
1 år sedan |
liukaiwen
|
6d728ddad0
Merge branch 'master' into dev-in-line-bbox
|
1 år sedan |
赵小蒙
|
7512baaaa3
重构drow_bbox为工具类
|
1 år sedan |
许瑞
|
2611e85349
feat: complete self check
|
1 år sedan |
赵小蒙
|
61a0c62c46
pdf_info_dict中间态结构调整
|
1 år sedan |
liukaiwen
|
1b4af400cc
Merge branch 'master' into dev-in-line-bbox
|
1 år sedan |
赵小蒙
|
f31117deba
debug时自动绘制layout区域和text区域
|
1 år sedan |
liukaiwen
|
94a7ba3d23
lkw
|
1 år sedan |
liukaiwen
|
da5091430b
Merge branch 'master' into dev-in-line-bbox
|
1 år sedan |
liukaiwen
|
83deab214e
lkw
|
1 år sedan |
赵小蒙
|
a5f8de9882
ocr模式增加截图功能
|
1 år sedan |
赵小蒙
|
17b09f7177
ocr pipeline更新
|
1 år sedan |
赵小蒙
|
864e95355f
span->line现基于模型的layout进行拼接
|
1 år sedan |
赵小蒙
|
f9bd004048
对模型的layout坐标转换
|
1 år sedan |
赵小蒙
|
f62d1aa781
将模型和pymu坐标的转换逻辑抽象成方法
|
1 år sedan |
赵小蒙
|
388223f2e0
ocr模式下删除header/page number/footnote/footer
|
1 år sedan |