| .. |
|
dict2md
|
b7652171ea
make_standard_format_with_para逻辑更新
|
преди 1 година |
|
filter
|
d5dbed7325
目录重构
|
преди 1 година |
|
layout
|
d5dbed7325
目录重构
|
преди 1 година |
|
libs
|
f36c26565e
使用面积占比方式判断一行文本是不是在一个layoutbox里
|
преди 1 година |
|
para
|
d3c9cb84f8
分段部分log限定在debug模式下才能输出
|
преди 1 година |
|
post_proc
|
71a042d9fc
footnote检测逻辑更新
|
преди 1 година |
|
pre_proc
|
154eed1ade
footnote drop逻辑更新
|
преди 1 година |
|
spark
|
7162debc38
实现文本拼PDF解析结果装标准格式
|
преди 1 година |
|
train_utils
|
efed5faa53
feat: modify foot note bbox tmp
|
преди 1 година |
|
__init__.py
|
d5dbed7325
目录重构
|
преди 1 година |
|
pdf_parse_by_model.py
|
f68c66290c
update code
|
преди 1 година |
|
pdf_parse_by_ocr.py
|
3d2fcc9dce
删除无用代码
|
преди 1 година |
|
pdf_parse_for_train.py
|
cb1b02e716
feat: disable auto include table title
|
преди 1 година |
|
pipeline.py
|
7162debc38
实现文本拼PDF解析结果装标准格式
|
преди 1 година |
|
pipeline_txt.py
|
7162debc38
实现文本拼PDF解析结果装标准格式
|
преди 1 година |