许瑞 4aa48329a4 feat: draw block based on block_type 1 год назад
..
ModelBlockTypeEnum.py d1a9d1db2f io modules 1 год назад
__init__.py d5dbed7325 目录重构 1 год назад
boxbase.py 5b2d81aab8 feat: support get images and tables 1 год назад
calc_span_stats.py d5dbed7325 目录重构 1 год назад
commons.py 0e2d0b8b4f parse_pdf_by_ocr 和 cut_image 重构,使用抽象类进行写出操作 1 год назад
config_reader.py 4de8810c18 update 1 год назад
convert_utils.py 709a65008a 中间态dict结构调整 1 год назад
coordinate_transform.py 7b0db8a4b3 将fix缩放倍率的bbox写入model_list 1 год назад
detect_language_from_model.py e492b3dce8 语言检测逻辑移动到parse流程 1 год назад
draw_bbox.py 4aa48329a4 feat: draw block based on block_type 1 год назад
drop_reason.py 1b9d65b3d3 1、Trace类的key增加前置下划线 1 год назад
drop_tag.py 45ce99bf87 block type 字段名修复 1 год назад
hash_utils.py 00f16239c6 实现parse_ocr_pdf api,切图逻辑s3使用平铺地址,本地使用层级地址,删除预设s3_image_save_path 1 год назад
json_compressor.py d5dbed7325 目录重构 1 год назад
language.py d5dbed7325 目录重构 1 год назад
markdown_utils.py 59b0b0c3da make markdown时特殊符号转义 1 год назад
math.py ebc2f057ef fix: remove_overlap leading zero height case 1 год назад
nlp_utils.py d5dbed7325 目录重构 1 год назад
ocr_content_type.py f5341e162f 重构 parse_by_ocr_v2.py 1 год назад
path_utils.py 55cba1f4ed feat: impl cli 1 год назад
pdf_image_tools.py 435ab922c6 Merge branch 'master' into master 1 год назад
safe_filename.py d5dbed7325 目录重构 1 год назад
textbase.py d5dbed7325 目录重构 1 год назад
vis_utils.py d5dbed7325 目录重构 1 год назад