| .. |
|
config
|
e698e7ca1e
fix: 调整 unclip_ratio 参数值以优化 OCR 识别效果
|
пре 6 дана |
|
core
|
e4304a8c0e
feat: 增强 PDF 文本提取逻辑,添加页级别类型检测,优化 OCR 使用条件
|
пре 6 дана |
|
dit_support
|
20d936e629
feat: 新增 DiT 支持模块及其核心功能
|
пре 2 недеља |
|
models
|
ca0374db5f
feat: 添加 pdf_type 参数以支持不同的 PDF 处理模式,优化识别逻辑
|
пре 6 дана |
|
tests
|
e8a1f6ece8
feat: 添加 PDF 旋转验证测试程序,支持不同角度的文本坐标验证与渲染一致性
|
пре 6 дана |
|
utils
|
9733ac0b36
feat: 更新多个工具的 README 文档,添加详细文档链接
|
пре 2 недеља |
|
__init__.py
|
565ef479fa
feat: Implement universal document parser with enhanced processing capabilities
|
пре 3 недеља |
|
main_v2.py
|
64652051e4
fix: 更新示例输入输出路径,修正注释以提高代码可读性
|
пре 1 недеља |