Commit History

Автор SHA1 Съобщение Дата
  Xiaomeng Zhao ea2f8ea0fd Merge branch 'dev' into dev преди 1 година
  myhloli e4810cee17 fix(remove_overlaps_min_spans): optimize overlap detection in OCR span list modification преди 1 година
  icecraft b492c19c4c refactor: move some constants or enums defs to config folder преди 1 година
  myhloli 5f992de4da fix(magic_pdf): prevent removal of low-confidence spans already dropped преди 1 година
  赵小蒙 e590729669 fix span overlap by confidence,remove duplicate spans преди 1 година
  赵小蒙 f70289f99e fix remove error преди 1 година
  赵小蒙 1936703b71 fix remove error преди 1 година
  赵小蒙 fcf94b2d9c change remove spans logic преди 1 година
  赵小蒙 45ce99bf87 block type 字段名修复 преди 1 година
  赵小蒙 dcf6e7127a 将ocr_parse逻辑切换到v2,并解决几个parse过程中的error преди 1 година
  赵小蒙 f5341e162f 重构 parse_by_ocr_v2.py преди 1 година
  赵小蒙 154eed1ade footnote drop逻辑更新 преди 1 година
  赵小蒙 5eab010b98 ocr模式对所有drop的span记录tag并分类 преди 1 година
  赵小蒙 a01356400e 修复spans为空list导致的IndexError: list index out of range преди 1 година
  赵小蒙 26c2378271 ocr模式下content type 抽象 преди 1 година
  赵小蒙 b6f051d88f 在layout.pdf中绘制drop的bbox преди 1 година
  赵小蒙 85587b257b 在dict中加入qa需要的字段 преди 1 година
  赵小蒙 b560c18fb4 fix import преди 1 година
  liukaiwen 8f2640826f Merge branch 'master' into dev-in-line-bbox преди 1 година
  liukaiwen 21cfaf4c0d add modify inline equation y axis преди 1 година
  赵小蒙 6f7aa890c2 fix import преди 1 година
  liukaiwen 64d67b5c58 add modify inline equation y axis преди 1 година
  赵小蒙 32fd7f958c 将对span的操作移动到ocr_span_list_modify,增加独占一行区块的位置调整逻辑 преди 1 година