myhloli
|
1807126e7f
refactor(ocr): adjust OCR processing parameters
|
преди 1 година |
myhloli
|
c34c9d21ef
refactor(ocr): improve image and table block handling
|
преди 1 година |
myhloli
|
1f1dd3538d
feat(list&index block): detect and merge list and index blocks
|
преди 1 година |
icecraft
|
03469909bb
Feat/support footnote in figure (#532)
|
преди 1 година |
赵小蒙
|
3c145ba0ca
fix: some text char removed by interline_equations overlap
|
преди 1 година |
赵小蒙
|
f1252e71bd
fix lost image bug
|
преди 1 година |
赵小蒙
|
eebd976715
remove overlap between with all blocks
|
преди 1 година |
赵小蒙
|
a817075b3c
update discarded block and spans build logic
|
преди 1 година |
赵小蒙
|
f01cb89f01
fix lost image or table bug
|
преди 1 година |
赵小蒙
|
1146206164
fix annotation
|
преди 1 година |
赵小蒙
|
ce992f271e
有些ocr的text和block框差异过大,降低fill阈值到0.7
|
преди 1 година |
赵小蒙
|
45ce99bf87
block type 字段名修复
|
преди 1 година |
赵小蒙
|
dcf6e7127a
将ocr_parse逻辑切换到v2,并解决几个parse过程中的error
|
преди 1 година |
赵小蒙
|
6b6bad4c58
解决互相引用导致的循环依赖问题
|
преди 1 година |
赵小蒙
|
54f165aac6
基于block内对spans做一些fix
|
преди 1 година |
赵小蒙
|
f5341e162f
重构 parse_by_ocr_v2.py
|
преди 1 година |
赵小蒙
|
7e8e9cabee
重构parse_by_ocr_v2
|
преди 1 година |
赵小蒙
|
90ea9096e5
部分layout最底部的文本圈不全,降低阈值减少底边文本被丢弃的可能性
|
преди 1 година |
赵小蒙
|
5eab010b98
ocr模式对所有drop的span记录tag并分类
|
преди 1 година |
赵小蒙
|
a01356400e
修复spans为空list导致的IndexError: list index out of range
|
преди 1 година |
赵小蒙
|
26c2378271
ocr模式下content type 抽象
|
преди 1 година |
赵小蒙
|
b6f051d88f
在layout.pdf中绘制drop的bbox
|
преди 1 година |
赵小蒙
|
85587b257b
在dict中加入qa需要的字段
|
преди 1 година |
liukaiwen
|
64d67b5c58
add modify inline equation y axis
|
преди 1 година |
liukaiwen
|
f5dc261da5
Merge branch 'master' into dev-in-line-bbox
|
преди 1 година |
liukaiwen
|
1f468bed0a
add modify inline equation y axis
|
преди 1 година |
赵小蒙
|
32fd7f958c
将对span的操作移动到ocr_span_list_modify,增加独占一行区块的位置调整逻辑
|
преди 1 година |
赵小蒙
|
86dc22caf3
remove_overlaps_min_spans阈值调整 0.8->0.65
|
преди 1 година |
赵小蒙
|
6396910992
移动modify_y_axis在pipeline中的位置
|
преди 1 година |
liukaiwen
|
5513e48ab8
add modify inline equation y axis
|
преди 1 година |