zhch158_admin cb83d24f8c feat(更新布局检测器与新增印章OCR适配器): 修改PaddleLayoutDetector和PPDocLayoutV3Detector类的类别映射,优化印章和图表的处理逻辑,同时新增SealOCRRecognizer适配器以支持印章OCR识别,提升文档解析与印章识别能力。 1 сар өмнө
..
config e72a51154f feat(新增印章补充检测功能): 在多个YAML配置文件中添加印章补充检测配置,启用PP-DocLayoutV3模型以提升对密封区域的识别能力,同时更新银行流水描述以反映新功能。 1 сар өмнө
core 797bad05df feat(增强文档处理管道): 在EnhancedDocPipeline类中添加印章OCR识别器的初始化与清理逻辑,更新图片相关元素类别以支持图表,优化印章元素处理流程,提升印章识别的准确性与灵活性。 1 сар өмнө
dit_support 20d936e629 feat: 新增 DiT 支持模块及其核心功能 6 сар өмнө
models cb83d24f8c feat(更新布局检测器与新增印章OCR适配器): 修改PaddleLayoutDetector和PPDocLayoutV3Detector类的类别映射,优化印章和图表的处理逻辑,同时新增SealOCRRecognizer适配器以支持印章OCR识别,提升文档解析与印章识别能力。 1 сар өмнө
tests a8ca9d4dc3 fix(优化二次OCR逻辑与参数): 更新二次OCR处理逻辑,增加对空单元格的判断,优化匹配框的使用,提升银行流水模式下的OCR准确性。同时调整相关测试用例以验证新逻辑的有效性。 1 сар өмнө
utils 9733ac0b36 feat: 更新多个工具的 README 文档,添加详细文档链接 6 сар өмнө
__init__.py 565ef479fa feat: Implement universal document parser with enhanced processing capabilities 6 сар өмнө
main_v2.py e7d756752c fix(更新OCR示例路径): 修改main_v2.py中的OCR示例输入输出路径,更新为新的文件名和目录,以便于后续测试和使用。 1 сар өмнө