| .. |
|
config
|
b210ab056b
fix(优化水印处理与布局检测配置): 更新多个bank_statement配置文件,调整水印去除设置,启用检测前处理,优化布局检测模块,新增OCR识别和表格分类功能,提升整体OCR处理的准确性与灵活性。
|
4 dienas atpakaļ |
|
core
|
398929fec5
fix(修复无效ocr_poly处理逻辑): 注释掉无效的ocr_poly和文本检查逻辑,确保在ocr_poly为空时返回None,提升代码的健壮性和可读性。
|
5 dienas atpakaļ |
|
dit_support
|
20d936e629
feat: 新增 DiT 支持模块及其核心功能
|
5 mēneši atpakaļ |
|
models
|
df98998bd5
feat(优化文本填充与OCR识别逻辑): 更新TextFiller类,新增短文本最小字符配置,重构识别逻辑以支持更灵活的文本解析和分数归一化,优化单元格对比度调整与增强功能,提升OCR处理的准确性与灵活性。
|
4 dienas atpakaļ |
|
tests
|
a2311846f1
feat(增强二次OCR处理与单元格预处理功能): 在test_second_pass_ocr_aggregate.py中新增测试类和用例,验证短文本最小字符配置、单元格预处理的对比度调整及水印处理逻辑,提升OCR处理的准确性与灵活性。
|
4 dienas atpakaļ |
|
utils
|
9733ac0b36
feat: 更新多个工具的 README 文档,添加详细文档链接
|
5 mēneši atpakaļ |
|
__init__.py
|
565ef479fa
feat: Implement universal document parser with enhanced processing capabilities
|
5 mēneši atpakaļ |
|
main_v2.py
|
0ad77c44e3
feat(增强调试功能): 在配置中添加水印去除调试选项,优化输出配置以支持模块调试,更新示例输入和页面范围,提升调试过程的灵活性和准确性。
|
6 dienas atpakaļ |