zhch158_admin
|
0b7809226c
feat: 添加PaddleOCR表格分类器适配器,支持有线/无线表格分类
|
3 dní pred |
zhch158_admin
|
630cf15a2d
feat: 添加表格分类器支持,优化表格识别路径选择
|
3 dní pred |
zhch158_admin
|
57bcb4628d
feat: 添加创建表格分类器的方法以区分有线/无线表格
|
3 dní pred |
zhch158_admin
|
768858cbff
feat: 添加可选的表格分类器参数以支持有线/无线表格的区分
|
3 dní pred |
zhch158_admin
|
a4b4be0968
feat: 添加布局后处理和表格分类配置,优化表格识别逻辑
|
3 dní pred |
zhch158_admin
|
c11f2ea045
feat: 添加 detect_page_type 方法以检测 PDF 页面类型(文本或扫描OCR)
|
3 dní pred |
zhch158_admin
|
f2079d9e4f
feat: 添加 detect_page_type 函数以检测 PDF 页面的类型(文字页或图片页)
|
3 dní pred |
zhch158_admin
|
ca0374db5f
feat: 添加 pdf_type 参数以支持不同的 PDF 处理模式,优化识别逻辑
|
3 dní pred |
zhch158_admin
|
54f5b5943d
fix: 将日志级别从 info 更改为 debug,以减少输出冗余
|
3 dní pred |
zhch158_admin
|
9d7afeff31
feat: 添加 pdf_type 参数以支持不同的 OCR 模式,优化二次 OCR 逻辑
|
3 dní pred |
zhch158_admin
|
bfd018969b
fix: 将日志级别从 info 更改为 debug,以减少输出冗余
|
3 dní pred |
zhch158_admin
|
e4304a8c0e
feat: 增强 PDF 文本提取逻辑,添加页级别类型检测,优化 OCR 使用条件
|
3 dní pred |
zhch158_admin
|
d68f33b382
feat: 添加 PDF 类型检测功能,优化文档处理逻辑,支持文本和 OCR 页面的识别
|
3 dní pred |
zhch158_admin
|
58d9568b0f
feat: add PDF text extraction module and refactor PDF utilities
|
4 dní pred |
zhch158_admin
|
e8a1f6ece8
feat: 添加 PDF 旋转验证测试程序,支持不同角度的文本坐标验证与渲染一致性
|
4 dní pred |
zhch158_admin
|
f86659f440
fix: 更新日志信息,包含倾斜阈值以便于调试
|
4 dní pred |
zhch158_admin
|
752de6fa64
fix: 优化 OCR 重新识别逻辑,调整置信度阈值并移除不必要的旋转处理
|
4 dní pred |
zhch158_admin
|
3b53b1f441
fix: 调整边缘过滤参数,修正 crop_padding 对应的计算逻辑
|
4 dní pred |
zhch158_admin
|
6791737004
feat: 增强 OCR 处理逻辑,支持 PDF 旋转角度提取与 OCR 结果对比
|
4 dní pred |
zhch158_admin
|
e698e7ca1e
fix: 调整 unclip_ratio 参数值以优化 OCR 识别效果
|
4 dní pred |
zhch158_admin
|
dd92babb27
feat: 改进文档处理流程,支持从 PDF 提取文本并与 OCR 结果对比,添加调试模式
|
4 dní pred |
zhch158_admin
|
dc9a615776
fix: 修复加载和分类文档时的参数传递,添加 renderer_used 参数
|
4 dní pred |
zhch158_admin
|
85f5dfa1f4
feat: 更新 process_text_element 方法,改进预匹配 spans 的处理逻辑,支持 OCR 和 PDF 文本提取来源
|
4 dní pred |
zhch158_admin
|
43d0e1c5d3
feat: 在 bank_statement_wired_unet 配置中启用调试模式
|
4 dní pred |
zhch158_admin
|
db1a81a141
feat: 添加 PDF 文档类型检测功能,支持 pypdfium2 和 fitz 渲染引擎,优化文本提取过程
|
4 dní pred |
zhch158_admin
|
939c825128
feat: Add `.gitignore` to exclude common development artifacts and specific project paths, and update `main_v2.py`.
|
4 dní pred |
zhch158_admin
|
ae0a19dc4d
chore: Add .gitignore to exclude various development and output files, and update main_v2.py.
|
5 dní pred |
zhch158_admin
|
481b5ea371
feat: add .gitignore to exclude common development artifacts, temporary files, and specific project outputs.
|
5 dní pred |
zhch158_admin
|
a4b8405df5
feat: 添加 bank_statement_wired_unet OCR 工具配置,支持结果目录和图像目录定义
|
5 dní pred |
zhch158_admin
|
f90f868f20
feat: 添加边缘线过滤功能,优化线段提取过程以减少噪声
|
5 dní pred |