| .. |
|
Constants.py
|
240fe99e3c
feat(table): integrate RapidTable model for table recognition
|
1 ano atrás |
|
MakeContentConfig.py
|
37fbe998ac
feat(ocr_mkcontent): support drop reason in none_with_reason modeEnable the `NONE_WITH_REASON` drop mode in `para_to_standard_format_v2` by updating the
|
1 ano atrás |
|
ModelBlockTypeEnum.py
|
d1a9d1db2f
io modules
|
1 ano atrás |
|
__init__.py
|
d5dbed7325
目录重构
|
1 ano atrás |
|
boxbase.py
|
1279f2cd0f
feat(model): add support for DocLayout-YOLO model
|
1 ano atrás |
|
calc_span_stats.py
|
d5dbed7325
目录重构
|
1 ano atrás |
|
clean_memory.py
|
4c9bf8abd5
refactor(memory management): remove unused clean_memory function
|
1 ano atrás |
|
commons.py
|
1de37e4c65
add version_name to middle json
|
1 ano atrás |
|
config_reader.py
|
e78edb193e
refactor(table): update default table model to Rapid Table
|
1 ano atrás |
|
convert_utils.py
|
709a65008a
中间态dict结构调整
|
1 ano atrás |
|
coordinate_transform.py
|
7b0db8a4b3
将fix缩放倍率的bbox写入model_list
|
1 ano atrás |
|
detect_language_from_model.py
|
e492b3dce8
语言检测逻辑移动到parse流程
|
1 ano atrás |
|
draw_bbox.py
|
7d5850e3ce
feat(model): add xycut algorithm for block sorting
|
1 ano atrás |
|
drop_reason.py
|
2f13b3a87c
add new drop scene
|
1 ano atrás |
|
drop_tag.py
|
45ce99bf87
block type 字段名修复
|
1 ano atrás |
|
hash_utils.py
|
00f16239c6
实现parse_ocr_pdf api,切图逻辑s3使用平铺地址,本地使用层级地址,删除预设s3_image_save_path
|
1 ano atrás |
|
json_compressor.py
|
d5dbed7325
目录重构
|
1 ano atrás |
|
language.py
|
57380cbed5
feat(language): add FT LANG cache directory setup
|
1 ano atrás |
|
local_math.py
|
12bec17eed
refactor(magic_pdf): replace math module with local_math
|
1 ano atrás |
|
markdown_utils.py
|
59b0b0c3da
make markdown时特殊符号转义
|
1 ano atrás |
|
nlp_utils.py
|
d5dbed7325
目录重构
|
1 ano atrás |
|
ocr_content_type.py
|
1f1dd3538d
feat(list&index block): detect and merge list and index blocks
|
1 ano atrás |
|
path_utils.py
|
6c656af65f
update:cleanup requirements.txt
|
1 ano atrás |
|
pdf_check.py
|
8998380da5
update check invalid_chars algorithm to improve accuracy
|
1 ano atrás |
|
pdf_image_tools.py
|
6a481320ea
fix: using new data api replace old rw api
|
1 ano atrás |
|
safe_filename.py
|
d5dbed7325
目录重构
|
1 ano atrás |
|
textbase.py
|
d5dbed7325
目录重构
|
1 ano atrás |
|
version.py
|
149132d608
feat(pdf_parse): improve span filtering and add new block types
|
1 ano atrás |
|
vis_utils.py
|
d5dbed7325
目录重构
|
1 ano atrás |