赵小蒙
|
f10b4a501f
s3_image_save_path统一配置
|
1 year ago |
赵小蒙
|
195998a07f
mk_mm_markdown2中span_type分类更新
|
1 year ago |
赵小蒙
|
25a0fd0665
Merge remote-tracking branch 'origin/master'
|
1 year ago |
赵小蒙
|
f06a32133c
make多模态markdown时图片地址更改为fullpath
|
1 year ago |
xuchao
|
084e9328d0
实现layout内部分段
|
1 year ago |
赵小蒙
|
59b0b0c3da
make markdown时特殊符号转义
|
1 year ago |
赵小蒙
|
9bd6294bfa
ocr模式更新spark pipeline
|
1 year ago |
赵小蒙
|
26c2378271
ocr模式下content type 抽象
|
1 year ago |
赵小蒙
|
b6f051d88f
在layout.pdf中绘制drop的bbox
|
1 year ago |
赵小蒙
|
ec1a6ef716
增加生成多模态markdown逻辑
|
1 year ago |
赵小蒙
|
00f3e329d9
修复一个span可能没有content导致的问题
|
1 year ago |
赵小蒙
|
701f384994
增加ocr版本解析功能
|
1 year ago |