zhch158_admin 3099890b65 feat(增强文本填充逻辑与边界框处理): 更新TextFiller类中的文本填充逻辑,确保在文本为空时返回0分数;新增多个静态方法以处理边界框的面积计算、嵌套框的识别和调试标签生成,提升OCR处理的准确性和可维护性。 il y a 5 jours
..
config 815592687a feat(添加单元格二次OCR配置): 在多个银行对账单配置文件中添加second_pass_ocr选项,增强OCR处理能力,支持低分块过滤和整格兜底,提高文本识别的准确性和灵活性。 il y a 5 jours
core 20b05456ab feat(增强调试功能): 在EnhancedDocPipeline类中添加_build_table_module_debug_override方法,以支持更灵活的调试选项构建,更新调试输出目录路径,优化表格模块的调试配置,提升调试过程的可定制性和准确性。 il y a 5 jours
dit_support 20d936e629 feat: 新增 DiT 支持模块及其核心功能 il y a 5 mois
models 3099890b65 feat(增强文本填充逻辑与边界框处理): 更新TextFiller类中的文本填充逻辑,确保在文本为空时返回0分数;新增多个静态方法以处理边界框的面积计算、嵌套框的识别和调试标签生成,提升OCR处理的准确性和可维护性。 il y a 5 jours
tests 8e61a877b0 feat(添加二次OCR聚合与择优逻辑单元测试): 新增针对二次OCR的聚合、择优逻辑及调试功能的单元测试,提升OCR处理的准确性和可维护性。 il y a 5 jours
utils 9733ac0b36 feat: 更新多个工具的 README 文档,添加详细文档链接 il y a 5 mois
__init__.py 565ef479fa feat: Implement universal document parser with enhanced processing capabilities il y a 5 mois
main_v2.py 0ad77c44e3 feat(增强调试功能): 在配置中添加水印去除调试选项,优化输出配置以支持模块调试,更新示例输入和页面范围,提升调试过程的灵活性和准确性。 il y a 6 jours