Historia zmian

Autor SHA1 Wiadomość Data
  赵小蒙 959b8d82d8 renamed pipeline file name 1 rok temu
  赵小蒙 c9af3457f5 delete useless files 1 rok temu
  赵小蒙 eebd976715 remove overlap between with all blocks 1 rok temu
  liukaiwen e31066bae5 更新了para_split 1 rok temu
  liukaiwen 1747066be3 更新了para_split_by_model 1 rok temu
  赵小蒙 7e8e9cabee 重构parse_by_ocr_v2 1 rok temu
  赵小蒙 18b02ae3bd Pipe类重构 1 rok temu
  赵小蒙 d438b97a0a 切图逻辑重构 1 rok temu
  赵小蒙 709a65008a 中间态dict结构调整 1 rok temu
  赵小蒙 0e2d0b8b4f parse_pdf_by_ocr 和 cut_image 重构,使用抽象类进行写出操作 1 rok temu
  赵小蒙 00f16239c6 实现parse_ocr_pdf api,切图逻辑s3使用平铺地址,本地使用层级地址,删除预设s3_image_save_path 1 rok temu
  赵小蒙 872cd73f4a pipeline重构 1 rok temu
  赵小蒙 fc10772503 ocr_construct_page_component 位置移动 1 rok temu
  赵小蒙 3d2fcc9dce 删除无用代码 1 rok temu
  赵小蒙 d3c9cb84f8 分段部分log限定在debug模式下才能输出 1 rok temu
  赵小蒙 8c089976ed 更新注释 1 rok temu
  赵小蒙 a4a9fd6934 Merge remote-tracking branch 'origin/master' 1 rok temu
  赵小蒙 ce96c3f67c 为ocr模式的demo增加online模式,pipeline进行微调适配online模式 1 rok temu
  xuchao acabae5624 实现页面与页面之间段落的合并 1 rok temu
  赵小蒙 5eab010b98 ocr模式对所有drop的span记录tag并分类 1 rok temu
  xuchao 084e9328d0 实现layout内部分段 1 rok temu
  赵小蒙 8a2736a53f 截图增加s3上传逻辑,移除宽或高为0的spans 1 rok temu
  赵小蒙 0b35b73c64 删除高度或者宽度为0的spans 1 rok temu
  赵小蒙 26c2378271 ocr模式下content type 抽象 1 rok temu
  赵小蒙 b6f051d88f 在layout.pdf中绘制drop的bbox 1 rok temu
  赵小蒙 85587b257b 在dict中加入qa需要的字段 1 rok temu
  liukaiwen 64d67b5c58 add modify inline equation y axis 1 rok temu
  liukaiwen f5dc261da5 Merge branch 'master' into dev-in-line-bbox 1 rok temu
  liukaiwen 1f468bed0a add modify inline equation y axis 1 rok temu
  赵小蒙 32fd7f958c 将对span的操作移动到ocr_span_list_modify,增加独占一行区块的位置调整逻辑 1 rok temu