赵小蒙
|
959b8d82d8
renamed pipeline file name
|
1 year ago |
赵小蒙
|
c9af3457f5
delete useless files
|
1 year ago |
赵小蒙
|
eebd976715
remove overlap between with all blocks
|
1 year ago |
liukaiwen
|
e31066bae5
更新了para_split
|
1 year ago |
liukaiwen
|
1747066be3
更新了para_split_by_model
|
1 year ago |
赵小蒙
|
7e8e9cabee
重构parse_by_ocr_v2
|
1 year ago |
赵小蒙
|
18b02ae3bd
Pipe类重构
|
1 year ago |
赵小蒙
|
d438b97a0a
切图逻辑重构
|
1 year ago |
赵小蒙
|
709a65008a
中间态dict结构调整
|
1 year ago |
赵小蒙
|
0e2d0b8b4f
parse_pdf_by_ocr 和 cut_image 重构,使用抽象类进行写出操作
|
1 year ago |
赵小蒙
|
00f16239c6
实现parse_ocr_pdf api,切图逻辑s3使用平铺地址,本地使用层级地址,删除预设s3_image_save_path
|
1 year ago |
赵小蒙
|
872cd73f4a
pipeline重构
|
1 year ago |
赵小蒙
|
fc10772503
ocr_construct_page_component 位置移动
|
1 year ago |
赵小蒙
|
3d2fcc9dce
删除无用代码
|
1 year ago |
赵小蒙
|
d3c9cb84f8
分段部分log限定在debug模式下才能输出
|
1 year ago |
赵小蒙
|
8c089976ed
更新注释
|
1 year ago |
赵小蒙
|
a4a9fd6934
Merge remote-tracking branch 'origin/master'
|
1 year ago |
赵小蒙
|
ce96c3f67c
为ocr模式的demo增加online模式,pipeline进行微调适配online模式
|
1 year ago |
xuchao
|
acabae5624
实现页面与页面之间段落的合并
|
1 year ago |
赵小蒙
|
5eab010b98
ocr模式对所有drop的span记录tag并分类
|
1 year ago |
xuchao
|
084e9328d0
实现layout内部分段
|
1 year ago |
赵小蒙
|
8a2736a53f
截图增加s3上传逻辑,移除宽或高为0的spans
|
1 year ago |
赵小蒙
|
0b35b73c64
删除高度或者宽度为0的spans
|
1 year ago |
赵小蒙
|
26c2378271
ocr模式下content type 抽象
|
1 year ago |
赵小蒙
|
b6f051d88f
在layout.pdf中绘制drop的bbox
|
1 year ago |
赵小蒙
|
85587b257b
在dict中加入qa需要的字段
|
1 year ago |
liukaiwen
|
64d67b5c58
add modify inline equation y axis
|
1 year ago |
liukaiwen
|
f5dc261da5
Merge branch 'master' into dev-in-line-bbox
|
1 year ago |
liukaiwen
|
1f468bed0a
add modify inline equation y axis
|
1 year ago |
赵小蒙
|
32fd7f958c
将对span的操作移动到ocr_span_list_modify,增加独占一行区块的位置调整逻辑
|
1 year ago |