| .. |
|
config
|
fb3ea48bb4
feat(新增银行交易流水场景配置): 添加银行交易流水V4场景配置,整合多种OCR识别功能及布局检测,支持有线和无线表格处理。
|
2 天之前 |
|
core
|
f32733271c
feat(优化水印处理): 在图像预处理流程中添加页级水印去除功能,更新相关处理器以支持跳过水印选项,提升表格方向校正的准确性。
|
2 天之前 |
|
dit_support
|
20d936e629
feat: 新增 DiT 支持模块及其核心功能
|
4 月之前 |
|
models
|
5f33763ee3
feat(增强OCR框架): 在TextFiller类中添加新的配置参数以处理OCR框的宽度溢出和邻格重叠,优化跨单元格检测逻辑,提升文本填充的准确性。
|
2 天之前 |
|
tests
|
5263c0e66c
fix(更新Python环境名称): 将测试文件中的Python环境名称从`mineru2`更新为`mineru`,确保一致性。
|
2 天之前 |
|
utils
|
9733ac0b36
feat: 更新多个工具的 README 文档,添加详细文档链接
|
4 月之前 |
|
__init__.py
|
565ef479fa
feat: Implement universal document parser with enhanced processing capabilities
|
4 月之前 |
|
main_v2.py
|
35ee4abec4
feat(更新OCR文档配置): 修改OCR文档配置,更新输入文件、输出目录和配置文件路径,调整处理页面数量以支持新的文档格式。
|
2 天之前 |