赵小蒙
|
c81f699e68
更新libs/config_reader,删除spark/s3.py
|
1 năm trước cách đây |
赵小蒙
|
016cde3ece
修复init错误
|
1 năm trước cách đây |
赵小蒙
|
575ca00e01
app.common依赖删除,pipeline_ocr重构
|
1 năm trước cách đây |
赵小蒙
|
7fcbae01fe
demo重构
|
1 năm trước cách đây |
赵小蒙
|
8ebb79a43a
standard_format dump逻辑更新
|
1 năm trước cách đây |
kernel.h@qq.com
|
61c970f7da
修复list index错误
|
1 năm trước cách đây |
kernel.h@qq.com
|
2e772467ee
连接跨页的list
|
1 năm trước cách đây |
赵小蒙
|
2277e31ff4
ocr_demo main函数精简
|
1 năm trước cách đây |
kernel.h@qq.com
|
f36c26565e
使用面积占比方式判断一行文本是不是在一个layoutbox里
|
1 năm trước cách đây |
kernel.h@qq.com
|
8e3beebd1a
修复index越界错误
|
1 năm trước cách đây |
kernel.h@qq.com
|
ef5d9137f4
实现对论文中列表的识别
|
1 năm trước cách đây |
kernel.h@qq.com
|
d062bb6ce9
merge
|
1 năm trước cách đây |
赵小蒙
|
ce96c3f67c
为ocr模式的demo增加online模式,pipeline进行微调适配online模式
|
1 năm trước cách đây |
赵小蒙
|
ef267e0957
qa需求定制输出
|
1 năm trước cách đây |
xuchao
|
7f0af412bc
增加layout之间段落连接规则
|
1 năm trước cách đây |
xuchao
|
83753cbd77
元素类型引用统一定义
|
1 năm trước cách đây |
赵小蒙
|
051ee3c3f5
增加标准格式的拼装逻辑
|
1 năm trước cách đây |
xuchao
|
084e9328d0
实现layout内部分段
|
1 năm trước cách đây |
赵小蒙
|
8a2736a53f
截图增加s3上传逻辑,移除宽或高为0的spans
|
1 năm trước cách đây |
赵小蒙
|
f31117deba
debug时自动绘制layout区域和text区域
|
1 năm trước cách đây |
赵小蒙
|
a5f8de9882
ocr模式增加截图功能
|
1 năm trước cách đây |
赵小蒙
|
864e95355f
span->line现基于模型的layout进行拼接
|
1 năm trước cách đây |
赵小蒙
|
388223f2e0
ocr模式下删除header/page number/footnote/footer
|
1 năm trước cách đây |
赵小蒙
|
fcea39d36b
增加ocr模式的layout解析功能
|
1 năm trước cách đây |
赵小蒙
|
a0be4652e6
parse_pdf_by_ocr 逻辑更新
|
1 năm trước cách đây |
赵小蒙
|
701f384994
增加ocr版本解析功能
|
1 năm trước cách đây |