Commit History

Upphovsman SHA1 Meddelande Datum
  赵小蒙 c81f699e68 更新libs/config_reader,删除spark/s3.py 1 år sedan
  赵小蒙 016cde3ece 修复init错误 1 år sedan
  赵小蒙 575ca00e01 app.common依赖删除,pipeline_ocr重构 1 år sedan
  赵小蒙 7fcbae01fe demo重构 1 år sedan
  赵小蒙 8ebb79a43a standard_format dump逻辑更新 1 år sedan
  kernel.h@qq.com 61c970f7da 修复list index错误 1 år sedan
  kernel.h@qq.com 2e772467ee 连接跨页的list 1 år sedan
  赵小蒙 2277e31ff4 ocr_demo main函数精简 1 år sedan
  kernel.h@qq.com f36c26565e 使用面积占比方式判断一行文本是不是在一个layoutbox里 1 år sedan
  kernel.h@qq.com 8e3beebd1a 修复index越界错误 1 år sedan
  kernel.h@qq.com ef5d9137f4 实现对论文中列表的识别 1 år sedan
  kernel.h@qq.com d062bb6ce9 merge 1 år sedan
  赵小蒙 ce96c3f67c 为ocr模式的demo增加online模式,pipeline进行微调适配online模式 1 år sedan
  赵小蒙 ef267e0957 qa需求定制输出 1 år sedan
  xuchao 7f0af412bc 增加layout之间段落连接规则 1 år sedan
  xuchao 83753cbd77 元素类型引用统一定义 1 år sedan
  赵小蒙 051ee3c3f5 增加标准格式的拼装逻辑 1 år sedan
  xuchao 084e9328d0 实现layout内部分段 1 år sedan
  赵小蒙 8a2736a53f 截图增加s3上传逻辑,移除宽或高为0的spans 1 år sedan
  赵小蒙 f31117deba debug时自动绘制layout区域和text区域 1 år sedan
  赵小蒙 a5f8de9882 ocr模式增加截图功能 1 år sedan
  赵小蒙 864e95355f span->line现基于模型的layout进行拼接 1 år sedan
  赵小蒙 388223f2e0 ocr模式下删除header/page number/footnote/footer 1 år sedan
  赵小蒙 fcea39d36b 增加ocr模式的layout解析功能 1 år sedan
  赵小蒙 a0be4652e6 parse_pdf_by_ocr 逻辑更新 1 år sedan
  赵小蒙 701f384994 增加ocr版本解析功能 1 år sedan