赵小蒙
|
0dbbf9c362
解决'[]'括起来的文本被识别成链接的问题
|
преди 1 година |
kernel.h@qq.com
|
056aed8677
制作OCR markdown
|
преди 1 година |
赵小蒙
|
c5624ace1e
line_to_standard_format 逻辑更新
|
преди 1 година |
赵小蒙
|
ef267e0957
qa需求定制输出
|
преди 1 година |
赵小蒙
|
051ee3c3f5
增加标准格式的拼装逻辑
|
преди 1 година |
赵小蒙
|
f10b4a501f
s3_image_save_path统一配置
|
преди 1 година |
赵小蒙
|
195998a07f
mk_mm_markdown2中span_type分类更新
|
преди 1 година |
赵小蒙
|
25a0fd0665
Merge remote-tracking branch 'origin/master'
|
преди 1 година |
赵小蒙
|
f06a32133c
make多模态markdown时图片地址更改为fullpath
|
преди 1 година |
xuchao
|
084e9328d0
实现layout内部分段
|
преди 1 година |
赵小蒙
|
59b0b0c3da
make markdown时特殊符号转义
|
преди 1 година |
赵小蒙
|
9bd6294bfa
ocr模式更新spark pipeline
|
преди 1 година |
赵小蒙
|
26c2378271
ocr模式下content type 抽象
|
преди 1 година |
赵小蒙
|
b6f051d88f
在layout.pdf中绘制drop的bbox
|
преди 1 година |
赵小蒙
|
ec1a6ef716
增加生成多模态markdown逻辑
|
преди 1 година |
赵小蒙
|
00f3e329d9
修复一个span可能没有content导致的问题
|
преди 1 година |
赵小蒙
|
701f384994
增加ocr版本解析功能
|
преди 1 година |