zhch158_admin
|
35ee4abec4
feat(更新OCR文档配置): 修改OCR文档配置,更新输入文件、输出目录和配置文件路径,调整处理页面数量以支持新的文档格式。
|
2 dagen geleden |
zhch158_admin
|
5f33763ee3
feat(增强OCR框架): 在TextFiller类中添加新的配置参数以处理OCR框的宽度溢出和邻格重叠,优化跨单元格检测逻辑,提升文本填充的准确性。
|
2 dagen geleden |
zhch158_admin
|
f32733271c
feat(优化水印处理): 在图像预处理流程中添加页级水印去除功能,更新相关处理器以支持跳过水印选项,提升表格方向校正的准确性。
|
2 dagen geleden |
zhch158_admin
|
3e4d9ab6f0
feat(新增文档配置): 添加三个新的OCR文档配置文件,分别为陈3_微信图、彭_广东兴宁农村商业银行和钟_广东陆丰农村商业银行,定义了使用的OCR工具及其结果目录。
|
2 dagen geleden |
zhch158_admin
|
5263c0e66c
fix(更新Python环境名称): 将测试文件中的Python环境名称从`mineru2`更新为`mineru`,确保一致性。
|
2 dagen geleden |
zhch158_admin
|
64ad4a204d
fix(修复倾斜角度检测): 修改SkewDetector类中的cv2.fitLine返回值处理,确保返回值显式转为标量,并更新异常处理为错误日志记录。
|
2 dagen geleden |
zhch158_admin
|
fb3ea48bb4
feat(新增银行交易流水场景配置): 添加银行交易流水V4场景配置,整合多种OCR识别功能及布局检测,支持有线和无线表格处理。
|
2 dagen geleden |
zhch158_admin
|
6518b09bbd
fix(更新环境名称): 将所有配置和文档中的`mineru2`环境名称更新为`mineru`,确保一致性和准确性。
|
2 dagen geleden |
zhch158_admin
|
1262c510b7
fix(调整内容顺序): 调整payload.json中的内容顺序,确保图像URL在文本之前
|
3 weken geleden |
zhch158_admin
|
6a4c6d2098
fix(调整内容顺序): 修改curl_local_mineru.sh和curl_local_ocr.sh中的内容顺序,确保图像URL在文本之前
|
3 weken geleden |
zhch158_admin
|
eee7efd233
fix(更新示例配置): 修改示例配置文件,更新输入文件、输出目录和日志文件路径
|
3 weken geleden |
zhch158_admin
|
ad99559dd2
fix(删除银行交易流水配置): 移除冗余的银行交易流水场景配置文件
|
3 weken geleden |
zhch158_admin
|
00fc409bd4
fix(移除冗余处理器配置): 删除yusys_mineru_local处理器配置,简化配置文件
|
3 weken geleden |
zhch158_admin
|
0456f4d088
fix(更新模型路径): 修改本地GGUF模型路径配置,确保模型正确加载
|
3 weken geleden |
zhch158_admin
|
1cd860a3a0
mineru gguf 无法解析表格
|
3 weken geleden |
zhch158_admin
|
d580a3564e
fix(更新VL识别配置): 修改VL识别配置注释,使用PaddleOcr-VL替代GLM-OCR
|
3 weken geleden |
zhch158_admin
|
c91cbc3423
feat(新增银行交易流水场景配置): 添加MinerU VL本地版配置文件,支持多种输入格式及OCR识别功能
|
3 weken geleden |
zhch158_admin
|
5dc0ce9298
feat(新增MinerU2.5-Pro本地守护进程): 添加MinerU2.5-Pro llama-server服务脚本,支持模型加载和管理
|
3 weken geleden |
zhch158_admin
|
7ce1273f1d
feat(更新模型路径): 修改本地GGUF模型路径配置,使用新的HF_CACHE路径以确保模型正确加载
|
3 weken geleden |
zhch158_admin
|
226a59b4b6
feat(新增YUSYS MinerU本地处理器配置): 添加YUSYS(local) Wired UNET OCR MinerU-VL处理器配置及相关参数
|
3 weken geleden |
zhch158_admin
|
3bb58ac275
feat(添加严农业银行文档配置): 新增严农业银行的OCR文档配置及相关工具设置
|
3 weken geleden |
zhch158_admin
|
87d30e6dc5
feat(移除VL识别模型参数): 删除不再需要的模型参数配置以简化设置
|
3 weken geleden |
zhch158_admin
|
0d52ee2e18
feat(更新处理器配置): 添加PaddleOCR处理器配置,更新日志目录,新增YUSYS本地处理器支持
|
3 weken geleden |
zhch158_admin
|
5bb909781f
feat(新增水印去除策略): 添加两层独立的水印去除能力,支持PDF层级和图像级水印处理
|
1 maand geleden |
zhch158_admin
|
de041fe413
feat(更新VL识别配置): 将GLM-OCR模块更改为PaddleOCR,更新相关参数以支持更大的图片尺寸和并发处理
|
1 maand geleden |
zhch158_admin
|
2fb3ee41cd
feat(添加模型别名支持): 在paddle_local_daemon.sh中添加模型别名配置,并在启动和配置输出中显示
|
1 maand geleden |
zhch158_admin
|
d1f002e9a7
feat(更新杨万益_福建农信文档配置): 修改输入输出路径和配置文件,更新日志文件路径
|
1 maand geleden |
zhch158_admin
|
abedc4e5b6
feat(更新PDF分类工具注释): 添加PDF分类工具的注释,说明优先使用MinerU原版及延迟导入策略
|
1 maand geleden |
zhch158_admin
|
fadba9a24b
fix(修复MinerU组件导入路径): 修改MinerU组件的导入路径以确保正确加载
|
1 maand geleden |
zhch158_admin
|
8032c96d96
feat(新增PDF文档类型分类工具): 添加PDF文档类型分类功能,支持判断可提取文本或需OCR
|
1 maand geleden |