zhch158_admin
|
985c776438
feat: 添加自定义Numpy编码器以支持JSON格式化,优化输出中的numpy数据处理
|
2 days ago |
zhch158_admin
|
69f11bfbcd
feat: 增强网格结构恢复逻辑,支持OCR边缘补偿功能,传递OCR结果以优化单元格提取
|
2 days ago |
zhch158_admin
|
87212bfd61
feat: 增加OCR边缘补偿功能,支持未封闭单元格的补偿,优化网格结构恢复逻辑
|
2 days ago |
zhch158_admin
|
7a99597a84
feat: 增强文档处理功能,支持OCR辅助合并单元格,优化输出配置逻辑
|
2 days ago |
zhch158_admin
|
f6c8b03d9c
feat: 增加OCR补偿功能以恢复缺失单元格,优化网格结构重建逻辑
|
2 days ago |
zhch158_admin
|
cb31f9e67f
feat: 移除详细验证和调试日志,简化网格结构恢复逻辑
|
3 days ago |
zhch158_admin
|
f32729046f
feat: 统一坐标系输出逻辑,增加return_upright_coords参数支持,优化文本提取功能
|
3 days ago |
zhch158_admin
|
44635af320
feat: 增强PDF旋转验证测试,添加return_upright_coords参数支持及结果对比功能
|
3 days ago |
zhch158_admin
|
10b6bdb6e4
feat: 更新页面方向识别逻辑,统一rotate_angle定义并处理文字PDF的旋转
|
3 days ago |
zhch158_admin
|
975ab2f230
feat: 更新二次OCR填充逻辑,增加OCR误合并检测和文本空值处理
|
3 days ago |
zhch158_admin
|
ea2eab596b
feat: 更新页面方向识别注释,明确rotate_angle用于图片旋转的角度
|
3 days ago |
zhch158_admin
|
4fd9362bb3
feat: 更新页面方向识别注释,明确图片旋转为正视的处理
|
3 days ago |
zhch158_admin
|
7a2a36a5bb
feat: 添加旋转角度约定差异文档,明确图像处理与方向分类模型的旋转约定
|
3 days ago |
zhch158_admin
|
5bb6e76629
feat: 更新表格OCR预处理,返回旋转前的尺寸信息
|
3 days ago |
zhch158_admin
|
0b7809226c
feat: 添加PaddleOCR表格分类器适配器,支持有线/无线表格分类
|
4 days ago |
zhch158_admin
|
630cf15a2d
feat: 添加表格分类器支持,优化表格识别路径选择
|
4 days ago |
zhch158_admin
|
57bcb4628d
feat: 添加创建表格分类器的方法以区分有线/无线表格
|
4 days ago |
zhch158_admin
|
768858cbff
feat: 添加可选的表格分类器参数以支持有线/无线表格的区分
|
4 days ago |
zhch158_admin
|
a4b4be0968
feat: 添加布局后处理和表格分类配置,优化表格识别逻辑
|
4 days ago |
zhch158_admin
|
c11f2ea045
feat: 添加 detect_page_type 方法以检测 PDF 页面类型(文本或扫描OCR)
|
4 days ago |
zhch158_admin
|
f2079d9e4f
feat: 添加 detect_page_type 函数以检测 PDF 页面的类型(文字页或图片页)
|
4 days ago |
zhch158_admin
|
ca0374db5f
feat: 添加 pdf_type 参数以支持不同的 PDF 处理模式,优化识别逻辑
|
4 days ago |
zhch158_admin
|
54f5b5943d
fix: 将日志级别从 info 更改为 debug,以减少输出冗余
|
4 days ago |
zhch158_admin
|
9d7afeff31
feat: 添加 pdf_type 参数以支持不同的 OCR 模式,优化二次 OCR 逻辑
|
4 days ago |
zhch158_admin
|
bfd018969b
fix: 将日志级别从 info 更改为 debug,以减少输出冗余
|
4 days ago |
zhch158_admin
|
e4304a8c0e
feat: 增强 PDF 文本提取逻辑,添加页级别类型检测,优化 OCR 使用条件
|
4 days ago |
zhch158_admin
|
d68f33b382
feat: 添加 PDF 类型检测功能,优化文档处理逻辑,支持文本和 OCR 页面的识别
|
4 days ago |
zhch158_admin
|
58d9568b0f
feat: add PDF text extraction module and refactor PDF utilities
|
5 days ago |
zhch158_admin
|
e8a1f6ece8
feat: 添加 PDF 旋转验证测试程序,支持不同角度的文本坐标验证与渲染一致性
|
5 days ago |
zhch158_admin
|
f86659f440
fix: 更新日志信息,包含倾斜阈值以便于调试
|
5 days ago |