赵小蒙
|
61a0c62c46
pdf_info_dict中间态结构调整
|
1 rok temu |
赵小蒙
|
f31117deba
debug时自动绘制layout区域和text区域
|
1 rok temu |
赵小蒙
|
a5f8de9882
ocr模式增加截图功能
|
1 rok temu |
赵小蒙
|
17b09f7177
ocr pipeline更新
|
1 rok temu |
赵小蒙
|
864e95355f
span->line现基于模型的layout进行拼接
|
1 rok temu |
赵小蒙
|
f9bd004048
对模型的layout坐标转换
|
1 rok temu |
赵小蒙
|
f62d1aa781
将模型和pymu坐标的转换逻辑抽象成方法
|
1 rok temu |
赵小蒙
|
388223f2e0
ocr模式下删除header/page number/footnote/footer
|
1 rok temu |
赵小蒙
|
fcea39d36b
增加ocr模式的layout解析功能
|
1 rok temu |
赵小蒙
|
caa1588a92
ocr拼接逻辑更新
|
1 rok temu |
赵小蒙
|
a0be4652e6
parse_pdf_by_ocr 逻辑更新
|
1 rok temu |
赵小蒙
|
701f384994
增加ocr版本解析功能
|
1 rok temu |