| .. |
|
config
|
815592687a
feat(添加单元格二次OCR配置): 在多个银行对账单配置文件中添加second_pass_ocr选项,增强OCR处理能力,支持低分块过滤和整格兜底,提高文本识别的准确性和灵活性。
|
пре 5 дана |
|
core
|
398929fec5
fix(修复无效ocr_poly处理逻辑): 注释掉无效的ocr_poly和文本检查逻辑,确保在ocr_poly为空时返回None,提升代码的健壮性和可读性。
|
пре 5 дана |
|
dit_support
|
20d936e629
feat: 新增 DiT 支持模块及其核心功能
|
пре 5 месеци |
|
models
|
3099890b65
feat(增强文本填充逻辑与边界框处理): 更新TextFiller类中的文本填充逻辑,确保在文本为空时返回0分数;新增多个静态方法以处理边界框的面积计算、嵌套框的识别和调试标签生成,提升OCR处理的准确性和可维护性。
|
пре 5 дана |
|
tests
|
e2bb737026
feat(新增单元格匹配框处理单元测试): 在test_second_pass_ocr_aggregate.py中新增TestResolveCellMatchedBoxes类,包含多个测试用例以验证单元格匹配框的处理逻辑,确保在不同情况下的文本填充和分数计算的准确性,提升OCR处理的可靠性和可维护性。
|
пре 5 дана |
|
utils
|
9733ac0b36
feat: 更新多个工具的 README 文档,添加详细文档链接
|
пре 5 месеци |
|
__init__.py
|
565ef479fa
feat: Implement universal document parser with enhanced processing capabilities
|
пре 5 месеци |
|
main_v2.py
|
0ad77c44e3
feat(增强调试功能): 在配置中添加水印去除调试选项,优化输出配置以支持模块调试,更新示例输入和页面范围,提升调试过程的灵活性和准确性。
|
пре 6 дана |