|
|
1 tydzień temu | |
|---|---|---|
| .. | ||
| core | 1 tydzień temu | |
| docs | 1 tydzień temu | |
| examples | 1 tydzień temu | |
| models | 1 tydzień temu | |
| parsers | 1 tydzień temu | |
| utils | 1 tydzień temu | |
| README.md | 1 tydzień temu | |
| main.py | 1 tydzień temu | |
| requirements.txt | 1 tydzień temu | |
| test_parser.py | 1 tydzień temu | |
一个功能强大的多模态文件解析服务,支持解析文本、图片、音频、视频、PDF和Office文档,使用本地部署的AI模型进行智能分析。
多文件类型支持:
智能解析:
性能统计:
duomotai/
├── core/ # 核心模块
│ ├── __pycache__/
│ └── router.py # 解析器工厂和路由逻辑
├── examples/ # 示例文件
├── models/ # 数据模型
│ ├── __pycache__/
│ └── result.py # 解析结果模型
├── output/ # 解析结果输出
├── parsers/ # 解析器实现
│ ├── __pycache__/
│ ├── audio_parser.py # 音频解析器
│ ├── native_parser.py # 原生文档解析器
│ ├── text_parser.py # 文本解析器
│ ├── video_parser.py # 视频解析器
│ └── visual_parser.py # 视觉文档解析器
├── utils/ # 工具类
│ ├── __pycache__/
│ ├── ffmpeg_wrapper.py # FFmpeg包装器
│ ├── logger.py # 日志工具
│ ├── mime_detector.py # MIME类型检测
│ └── stability.py # 稳定性工具
├── main.py # 主入口
├── test_parser.py # 测试脚本
├── requirements.txt # 依赖管理
└── README.md # 项目说明
FFmpeg:用于音频提取和视频处理
brew install ffmpegapt-get install ffmpegyum install ffmpegantiword:用于解析.doc文件
brew install antiwordapt-get install antiwordyum install antiwordpip install -r requirements.txt
需要部署以下本地AI模型:
Qwen3-ASR:用于语音识别
http://10.192.72.13:7283/v1/audio/transcriptionsQwen3-VL:用于视觉分析
http://10.192.72.13:7280/v1/chat/completionsMinerU:用于文档OCR
http://10.192.72.13:7284/file_parsepython main.py <file_path> [--output json|markdown]
示例:
python main.py examples/65_1770022874.mp4 --output markdown
python test_parser.py
这将解析examples目录下的所有文件,并生成详细的性能报告。
# 解析性能报告
## 总体情况
- 总解析文件数: 13
- 成功解析: 13
- 解析失败: 0
- 总文件大小: 50.16 MB
- 总耗时: 106.40 秒
- 平均解析速度: 0.47 MB/秒
## 文件类型分布
- 文本文件: 0 个, 0.00 MB, 占比: 0.00%
- 图片文件: 5 个, 8.41 MB, 占比: 16.76%
- 音频文件: 1 个, 9.15 MB, 占比: 18.25%
- 视频文件: 1 个, 22.58 MB, 占比: 45.01%
- PDF文件: 3 个, 7.79 MB, 占比: 15.54%
- Office文件: 0 个, 0.00 MB, 占比: 0.00%
## 性能分析
- 文本类平均解析速度: 0.00 MB/秒 (如果有文本文件)
- 图片类平均解析速度: 0.08 MB/秒 (如果有图片文件)
- 音频类平均解析速度: 0.09 MB/秒 (如果有音频文件)
- 视频类平均解析速度: 0.21 MB/秒 (如果有视频文件)
解析过程中的详细日志会输出到控制台,有助于排查问题。
本项目采用MIT许可证。
如有问题或建议,请联系项目维护者。