Historia zmian

Autor SHA1 Wiadomość Data
  kernel.h@qq.com f36c26565e 使用面积占比方式判断一行文本是不是在一个layoutbox里 1 rok temu
  kernel.h@qq.com 8e3beebd1a 修复index越界错误 1 rok temu
  kernel.h@qq.com ef5d9137f4 实现对论文中列表的识别 1 rok temu
  kernel.h@qq.com d062bb6ce9 merge 1 rok temu
  赵小蒙 ce96c3f67c 为ocr模式的demo增加online模式,pipeline进行微调适配online模式 1 rok temu
  赵小蒙 ef267e0957 qa需求定制输出 1 rok temu
  xuchao 7f0af412bc 增加layout之间段落连接规则 1 rok temu
  xuchao 83753cbd77 元素类型引用统一定义 1 rok temu
  赵小蒙 051ee3c3f5 增加标准格式的拼装逻辑 1 rok temu
  xuchao 084e9328d0 实现layout内部分段 1 rok temu
  赵小蒙 8a2736a53f 截图增加s3上传逻辑,移除宽或高为0的spans 1 rok temu
  赵小蒙 f31117deba debug时自动绘制layout区域和text区域 1 rok temu
  赵小蒙 a5f8de9882 ocr模式增加截图功能 1 rok temu
  赵小蒙 864e95355f span->line现基于模型的layout进行拼接 1 rok temu
  赵小蒙 388223f2e0 ocr模式下删除header/page number/footnote/footer 1 rok temu
  赵小蒙 fcea39d36b 增加ocr模式的layout解析功能 1 rok temu
  赵小蒙 a0be4652e6 parse_pdf_by_ocr 逻辑更新 1 rok temu
  赵小蒙 701f384994 增加ocr版本解析功能 1 rok temu