Commit történet

Szerző SHA1 Üzenet Dátum
  myhloli be505a958c fix(pre_proc): improve character overlap handling in OCR processing 7 hónapja
  myhloli 3f2bafa88f feat(pre_proc): add function to remove x-overlapping characters in spans 8 hónapja
  myhloli f37b14bc83 refactor(pre_proc): adjust IOU threshold for character overlap detection 10 hónapja
  myhloli 15e876677d refactor(pre_proc): improve character overlap handling in spans 11 hónapja
  myhloli 2f4d4b0c80 feat(pre_proc): add function to remove overlapping characters in spans 11 hónapja
  myhloli 21fa78195e refactor(pre_proc): remove unused functions and simplify code 11 hónapja
  Xiaomeng Zhao ea2f8ea0fd Merge branch 'dev' into dev 1 éve
  myhloli e4810cee17 fix(remove_overlaps_min_spans): optimize overlap detection in OCR span list modification 1 éve
  icecraft b492c19c4c refactor: move some constants or enums defs to config folder 1 éve
  myhloli 5f992de4da fix(magic_pdf): prevent removal of low-confidence spans already dropped 1 éve
  赵小蒙 e590729669 fix span overlap by confidence,remove duplicate spans 1 éve
  赵小蒙 f70289f99e fix remove error 1 éve
  赵小蒙 1936703b71 fix remove error 1 éve
  赵小蒙 fcf94b2d9c change remove spans logic 1 éve
  赵小蒙 45ce99bf87 block type 字段名修复 1 éve
  赵小蒙 dcf6e7127a 将ocr_parse逻辑切换到v2,并解决几个parse过程中的error 1 éve
  赵小蒙 f5341e162f 重构 parse_by_ocr_v2.py 1 éve
  赵小蒙 154eed1ade footnote drop逻辑更新 1 éve
  赵小蒙 5eab010b98 ocr模式对所有drop的span记录tag并分类 1 éve
  赵小蒙 a01356400e 修复spans为空list导致的IndexError: list index out of range 1 éve
  赵小蒙 26c2378271 ocr模式下content type 抽象 1 éve
  赵小蒙 b6f051d88f 在layout.pdf中绘制drop的bbox 1 éve
  赵小蒙 85587b257b 在dict中加入qa需要的字段 1 éve
  赵小蒙 b560c18fb4 fix import 1 éve
  liukaiwen 8f2640826f Merge branch 'master' into dev-in-line-bbox 1 éve
  liukaiwen 21cfaf4c0d add modify inline equation y axis 1 éve
  赵小蒙 6f7aa890c2 fix import 1 éve
  liukaiwen 64d67b5c58 add modify inline equation y axis 1 éve
  赵小蒙 32fd7f958c 将对span的操作移动到ocr_span_list_modify,增加独占一行区块的位置调整逻辑 1 éve