| .. |
|
config
|
815592687a
feat(添加单元格二次OCR配置): 在多个银行对账单配置文件中添加second_pass_ocr选项,增强OCR处理能力,支持低分块过滤和整格兜底,提高文本识别的准确性和灵活性。
|
hai 5 días |
|
core
|
20b05456ab
feat(增强调试功能): 在EnhancedDocPipeline类中添加_build_table_module_debug_override方法,以支持更灵活的调试选项构建,更新调试输出目录路径,优化表格模块的调试配置,提升调试过程的可定制性和准确性。
|
hai 5 días |
|
dit_support
|
20d936e629
feat: 新增 DiT 支持模块及其核心功能
|
hai 5 meses |
|
models
|
5511510558
feat(增强单元格OCR调试功能): 在MinerUWiredTableRecognizer类中添加debug_prefix参数,以支持更灵活的调试输出,提升OCR处理的可追踪性和调试效率。
|
hai 5 días |
|
tests
|
5263c0e66c
fix(更新Python环境名称): 将测试文件中的Python环境名称从`mineru2`更新为`mineru`,确保一致性。
|
hai 1 semana |
|
utils
|
9733ac0b36
feat: 更新多个工具的 README 文档,添加详细文档链接
|
hai 5 meses |
|
__init__.py
|
565ef479fa
feat: Implement universal document parser with enhanced processing capabilities
|
hai 5 meses |
|
main_v2.py
|
0ad77c44e3
feat(增强调试功能): 在配置中添加水印去除调试选项,优化输出配置以支持模块调试,更新示例输入和页面范围,提升调试过程的灵活性和准确性。
|
hai 6 días |