Historie revizí

Autor SHA1 Zpráva Datum
  赵小蒙 959b8d82d8 renamed pipeline file name před 1 rokem
  赵小蒙 c9af3457f5 delete useless files před 1 rokem
  赵小蒙 eebd976715 remove overlap between with all blocks před 1 rokem
  liukaiwen e31066bae5 更新了para_split před 1 rokem
  liukaiwen 1747066be3 更新了para_split_by_model před 1 rokem
  赵小蒙 7e8e9cabee 重构parse_by_ocr_v2 před 1 rokem
  赵小蒙 18b02ae3bd Pipe类重构 před 1 rokem
  赵小蒙 d438b97a0a 切图逻辑重构 před 1 rokem
  赵小蒙 709a65008a 中间态dict结构调整 před 1 rokem
  赵小蒙 0e2d0b8b4f parse_pdf_by_ocr 和 cut_image 重构,使用抽象类进行写出操作 před 1 rokem
  赵小蒙 00f16239c6 实现parse_ocr_pdf api,切图逻辑s3使用平铺地址,本地使用层级地址,删除预设s3_image_save_path před 1 rokem
  赵小蒙 872cd73f4a pipeline重构 před 1 rokem
  赵小蒙 fc10772503 ocr_construct_page_component 位置移动 před 1 rokem
  赵小蒙 3d2fcc9dce 删除无用代码 před 1 rokem
  赵小蒙 d3c9cb84f8 分段部分log限定在debug模式下才能输出 před 1 rokem
  赵小蒙 8c089976ed 更新注释 před 1 rokem
  赵小蒙 a4a9fd6934 Merge remote-tracking branch 'origin/master' před 1 rokem
  赵小蒙 ce96c3f67c 为ocr模式的demo增加online模式,pipeline进行微调适配online模式 před 1 rokem
  xuchao acabae5624 实现页面与页面之间段落的合并 před 1 rokem
  赵小蒙 5eab010b98 ocr模式对所有drop的span记录tag并分类 před 1 rokem
  xuchao 084e9328d0 实现layout内部分段 před 1 rokem
  赵小蒙 8a2736a53f 截图增加s3上传逻辑,移除宽或高为0的spans před 1 rokem
  赵小蒙 0b35b73c64 删除高度或者宽度为0的spans před 1 rokem
  赵小蒙 26c2378271 ocr模式下content type 抽象 před 1 rokem
  赵小蒙 b6f051d88f 在layout.pdf中绘制drop的bbox před 1 rokem
  赵小蒙 85587b257b 在dict中加入qa需要的字段 před 1 rokem
  liukaiwen 64d67b5c58 add modify inline equation y axis před 1 rokem
  liukaiwen f5dc261da5 Merge branch 'master' into dev-in-line-bbox před 1 rokem
  liukaiwen 1f468bed0a add modify inline equation y axis před 1 rokem
  赵小蒙 32fd7f958c 将对span的操作移动到ocr_span_list_modify,增加独占一行区块的位置调整逻辑 před 1 rokem