myhloli
|
be505a958c
fix(pre_proc): improve character overlap handling in OCR processing
|
7 luni în urmă |
myhloli
|
3f2bafa88f
feat(pre_proc): add function to remove x-overlapping characters in spans
|
8 luni în urmă |
myhloli
|
f37b14bc83
refactor(pre_proc): adjust IOU threshold for character overlap detection
|
10 luni în urmă |
myhloli
|
15e876677d
refactor(pre_proc): improve character overlap handling in spans
|
11 luni în urmă |
myhloli
|
2f4d4b0c80
feat(pre_proc): add function to remove overlapping characters in spans
|
11 luni în urmă |
myhloli
|
21fa78195e
refactor(pre_proc): remove unused functions and simplify code
|
11 luni în urmă |
Xiaomeng Zhao
|
ea2f8ea0fd
Merge branch 'dev' into dev
|
1 an în urmă |
myhloli
|
e4810cee17
fix(remove_overlaps_min_spans): optimize overlap detection in OCR span list modification
|
1 an în urmă |
icecraft
|
b492c19c4c
refactor: move some constants or enums defs to config folder
|
1 an în urmă |
myhloli
|
5f992de4da
fix(magic_pdf): prevent removal of low-confidence spans already dropped
|
1 an în urmă |
赵小蒙
|
e590729669
fix span overlap by confidence,remove duplicate spans
|
1 an în urmă |
赵小蒙
|
f70289f99e
fix remove error
|
1 an în urmă |
赵小蒙
|
1936703b71
fix remove error
|
1 an în urmă |
赵小蒙
|
fcf94b2d9c
change remove spans logic
|
1 an în urmă |
赵小蒙
|
45ce99bf87
block type 字段名修复
|
1 an în urmă |
赵小蒙
|
dcf6e7127a
将ocr_parse逻辑切换到v2,并解决几个parse过程中的error
|
1 an în urmă |
赵小蒙
|
f5341e162f
重构 parse_by_ocr_v2.py
|
1 an în urmă |
赵小蒙
|
154eed1ade
footnote drop逻辑更新
|
1 an în urmă |
赵小蒙
|
5eab010b98
ocr模式对所有drop的span记录tag并分类
|
1 an în urmă |
赵小蒙
|
a01356400e
修复spans为空list导致的IndexError: list index out of range
|
1 an în urmă |
赵小蒙
|
26c2378271
ocr模式下content type 抽象
|
1 an în urmă |
赵小蒙
|
b6f051d88f
在layout.pdf中绘制drop的bbox
|
1 an în urmă |
赵小蒙
|
85587b257b
在dict中加入qa需要的字段
|
1 an în urmă |
赵小蒙
|
b560c18fb4
fix import
|
1 an în urmă |
liukaiwen
|
8f2640826f
Merge branch 'master' into dev-in-line-bbox
|
1 an în urmă |
liukaiwen
|
21cfaf4c0d
add modify inline equation y axis
|
1 an în urmă |
赵小蒙
|
6f7aa890c2
fix import
|
1 an în urmă |
liukaiwen
|
64d67b5c58
add modify inline equation y axis
|
1 an în urmă |
赵小蒙
|
32fd7f958c
将对span的操作移动到ocr_span_list_modify,增加独占一行区块的位置调整逻辑
|
1 an în urmă |