Commit Verlauf

Autor SHA1 Nachricht Datum
  赵小蒙 c81f699e68 更新libs/config_reader,删除spark/s3.py vor 1 Jahr
  赵小蒙 016cde3ece 修复init错误 vor 1 Jahr
  赵小蒙 575ca00e01 app.common依赖删除,pipeline_ocr重构 vor 1 Jahr
  赵小蒙 7fcbae01fe demo重构 vor 1 Jahr
  赵小蒙 8ebb79a43a standard_format dump逻辑更新 vor 1 Jahr
  kernel.h@qq.com 61c970f7da 修复list index错误 vor 1 Jahr
  kernel.h@qq.com 2e772467ee 连接跨页的list vor 1 Jahr
  赵小蒙 2277e31ff4 ocr_demo main函数精简 vor 1 Jahr
  kernel.h@qq.com f36c26565e 使用面积占比方式判断一行文本是不是在一个layoutbox里 vor 1 Jahr
  kernel.h@qq.com 8e3beebd1a 修复index越界错误 vor 1 Jahr
  kernel.h@qq.com ef5d9137f4 实现对论文中列表的识别 vor 1 Jahr
  kernel.h@qq.com d062bb6ce9 merge vor 1 Jahr
  赵小蒙 ce96c3f67c 为ocr模式的demo增加online模式,pipeline进行微调适配online模式 vor 1 Jahr
  赵小蒙 ef267e0957 qa需求定制输出 vor 1 Jahr
  xuchao 7f0af412bc 增加layout之间段落连接规则 vor 1 Jahr
  xuchao 83753cbd77 元素类型引用统一定义 vor 1 Jahr
  赵小蒙 051ee3c3f5 增加标准格式的拼装逻辑 vor 1 Jahr
  xuchao 084e9328d0 实现layout内部分段 vor 1 Jahr
  赵小蒙 8a2736a53f 截图增加s3上传逻辑,移除宽或高为0的spans vor 1 Jahr
  赵小蒙 f31117deba debug时自动绘制layout区域和text区域 vor 1 Jahr
  赵小蒙 a5f8de9882 ocr模式增加截图功能 vor 1 Jahr
  赵小蒙 864e95355f span->line现基于模型的layout进行拼接 vor 1 Jahr
  赵小蒙 388223f2e0 ocr模式下删除header/page number/footnote/footer vor 1 Jahr
  赵小蒙 fcea39d36b 增加ocr模式的layout解析功能 vor 1 Jahr
  赵小蒙 a0be4652e6 parse_pdf_by_ocr 逻辑更新 vor 1 Jahr
  赵小蒙 701f384994 增加ocr版本解析功能 vor 1 Jahr