赵小蒙
|
f70289f99e
fix remove error
|
1 anno fa |
赵小蒙
|
1936703b71
fix remove error
|
1 anno fa |
赵小蒙
|
fcf94b2d9c
change remove spans logic
|
1 anno fa |
赵小蒙
|
45ce99bf87
block type 字段名修复
|
1 anno fa |
赵小蒙
|
dcf6e7127a
将ocr_parse逻辑切换到v2,并解决几个parse过程中的error
|
1 anno fa |
赵小蒙
|
f5341e162f
重构 parse_by_ocr_v2.py
|
1 anno fa |
赵小蒙
|
154eed1ade
footnote drop逻辑更新
|
1 anno fa |
赵小蒙
|
5eab010b98
ocr模式对所有drop的span记录tag并分类
|
1 anno fa |
赵小蒙
|
a01356400e
修复spans为空list导致的IndexError: list index out of range
|
1 anno fa |
赵小蒙
|
26c2378271
ocr模式下content type 抽象
|
1 anno fa |
赵小蒙
|
b6f051d88f
在layout.pdf中绘制drop的bbox
|
1 anno fa |
赵小蒙
|
85587b257b
在dict中加入qa需要的字段
|
1 anno fa |
赵小蒙
|
b560c18fb4
fix import
|
1 anno fa |
liukaiwen
|
8f2640826f
Merge branch 'master' into dev-in-line-bbox
|
1 anno fa |
liukaiwen
|
21cfaf4c0d
add modify inline equation y axis
|
1 anno fa |
赵小蒙
|
6f7aa890c2
fix import
|
1 anno fa |
liukaiwen
|
64d67b5c58
add modify inline equation y axis
|
1 anno fa |
赵小蒙
|
32fd7f958c
将对span的操作移动到ocr_span_list_modify,增加独占一行区块的位置调整逻辑
|
1 anno fa |