myhloli a99689d4d0 Update version.py with new version 1 年之前
..
cli c4fc4d5c66 format 1 年之前
dict2md 5de013e6d5 fix:use line_lang instead of content_lang to concatenate para 1 年之前
filter df14c61f6f update: Enhance the capability to detect garbled document issues 1 年之前
layout d5dbed7325 目录重构 1 年之前
libs a99689d4d0 Update version.py with new version 1 年之前
model 389826c5fe update custom model framework 1 年之前
para 2284e0d77b 修复分段边界问题 1 年之前
pipe df14c61f6f update: Enhance the capability to detect garbled document issues 1 年之前
post_proc 1b9d65b3d3 1、Trace类的key增加前置下划线 1 年之前
pre_proc e92de75844 add todo about interline_equation 1 年之前
rw 5db8911daa add errors="replace" in write mode MODE_TXT 1 年之前
spark 709a65008a 中间态dict结构调整 1 年之前
train_utils efed5faa53 feat: modify foot note bbox tmp 1 年之前
__init__.py d5dbed7325 目录重构 1 年之前
pdf_parse_by_ocr.py eebd976715 remove overlap between with all blocks 1 年之前
pdf_parse_by_ocr_v2.py 87ac340ae7 rebuild parse logic 1 年之前
pdf_parse_by_txt.py d438b97a0a 切图逻辑重构 1 年之前
pdf_parse_by_txt_v2.py 87ac340ae7 rebuild parse logic 1 年之前
pdf_parse_for_train.py d438b97a0a 切图逻辑重构 1 年之前
pdf_parse_union_core.py e92de75844 add todo about interline_equation 1 年之前
pipeline.bak 1b9d65b3d3 1、Trace类的key增加前置下划线 1 年之前
pipeline_ocr.bak 1b9d65b3d3 1、Trace类的key增加前置下划线 1 年之前
pipeline_txt.bak 1b9d65b3d3 1、Trace类的key增加前置下划线 1 年之前
user_api.py df14c61f6f update: Enhance the capability to detect garbled document issues 1 年之前