zhch158_admin
|
cb31f9e67f
feat: 移除详细验证和调试日志,简化网格结构恢复逻辑
|
3 dagen geleden |
zhch158_admin
|
f32729046f
feat: 统一坐标系输出逻辑,增加return_upright_coords参数支持,优化文本提取功能
|
3 dagen geleden |
zhch158_admin
|
44635af320
feat: 增强PDF旋转验证测试,添加return_upright_coords参数支持及结果对比功能
|
3 dagen geleden |
zhch158_admin
|
10b6bdb6e4
feat: 更新页面方向识别逻辑,统一rotate_angle定义并处理文字PDF的旋转
|
3 dagen geleden |
zhch158_admin
|
975ab2f230
feat: 更新二次OCR填充逻辑,增加OCR误合并检测和文本空值处理
|
3 dagen geleden |
zhch158_admin
|
ea2eab596b
feat: 更新页面方向识别注释,明确rotate_angle用于图片旋转的角度
|
3 dagen geleden |
zhch158_admin
|
4fd9362bb3
feat: 更新页面方向识别注释,明确图片旋转为正视的处理
|
3 dagen geleden |
zhch158_admin
|
7a2a36a5bb
feat: 添加旋转角度约定差异文档,明确图像处理与方向分类模型的旋转约定
|
3 dagen geleden |
zhch158_admin
|
5bb6e76629
feat: 更新表格OCR预处理,返回旋转前的尺寸信息
|
3 dagen geleden |
zhch158_admin
|
0b7809226c
feat: 添加PaddleOCR表格分类器适配器,支持有线/无线表格分类
|
4 dagen geleden |
zhch158_admin
|
630cf15a2d
feat: 添加表格分类器支持,优化表格识别路径选择
|
4 dagen geleden |
zhch158_admin
|
57bcb4628d
feat: 添加创建表格分类器的方法以区分有线/无线表格
|
4 dagen geleden |
zhch158_admin
|
768858cbff
feat: 添加可选的表格分类器参数以支持有线/无线表格的区分
|
4 dagen geleden |
zhch158_admin
|
a4b4be0968
feat: 添加布局后处理和表格分类配置,优化表格识别逻辑
|
4 dagen geleden |
zhch158_admin
|
c11f2ea045
feat: 添加 detect_page_type 方法以检测 PDF 页面类型(文本或扫描OCR)
|
4 dagen geleden |
zhch158_admin
|
f2079d9e4f
feat: 添加 detect_page_type 函数以检测 PDF 页面的类型(文字页或图片页)
|
4 dagen geleden |
zhch158_admin
|
ca0374db5f
feat: 添加 pdf_type 参数以支持不同的 PDF 处理模式,优化识别逻辑
|
4 dagen geleden |
zhch158_admin
|
54f5b5943d
fix: 将日志级别从 info 更改为 debug,以减少输出冗余
|
4 dagen geleden |
zhch158_admin
|
9d7afeff31
feat: 添加 pdf_type 参数以支持不同的 OCR 模式,优化二次 OCR 逻辑
|
4 dagen geleden |
zhch158_admin
|
bfd018969b
fix: 将日志级别从 info 更改为 debug,以减少输出冗余
|
4 dagen geleden |
zhch158_admin
|
e4304a8c0e
feat: 增强 PDF 文本提取逻辑,添加页级别类型检测,优化 OCR 使用条件
|
4 dagen geleden |
zhch158_admin
|
d68f33b382
feat: 添加 PDF 类型检测功能,优化文档处理逻辑,支持文本和 OCR 页面的识别
|
4 dagen geleden |
zhch158_admin
|
58d9568b0f
feat: add PDF text extraction module and refactor PDF utilities
|
5 dagen geleden |
zhch158_admin
|
e8a1f6ece8
feat: 添加 PDF 旋转验证测试程序,支持不同角度的文本坐标验证与渲染一致性
|
5 dagen geleden |
zhch158_admin
|
f86659f440
fix: 更新日志信息,包含倾斜阈值以便于调试
|
5 dagen geleden |
zhch158_admin
|
752de6fa64
fix: 优化 OCR 重新识别逻辑,调整置信度阈值并移除不必要的旋转处理
|
5 dagen geleden |
zhch158_admin
|
3b53b1f441
fix: 调整边缘过滤参数,修正 crop_padding 对应的计算逻辑
|
5 dagen geleden |
zhch158_admin
|
6791737004
feat: 增强 OCR 处理逻辑,支持 PDF 旋转角度提取与 OCR 结果对比
|
5 dagen geleden |
zhch158_admin
|
e698e7ca1e
fix: 调整 unclip_ratio 参数值以优化 OCR 识别效果
|
5 dagen geleden |
zhch158_admin
|
dd92babb27
feat: 改进文档处理流程,支持从 PDF 提取文本并与 OCR 结果对比,添加调试模式
|
5 dagen geleden |