|
|
@@ -62,9 +62,8 @@
|
|
|
- 令人难以置信的全能单模型,支持多语言识别、手写识别、layout分析、表格解析、公式解析、阅读顺序排序等功能。
|
|
|
- 极致的解析速度,在单卡4090上超过 10000 token/s的峰值吞吐量(使用sglang加速),满足大规模文档解析需求。
|
|
|
- **不兼容更新**:
|
|
|
- - MinerU 2.0 完全重构了代码架构和模型集成方式,因此与1.x版本不兼容,用户需要重新安装和配置。
|
|
|
- - 由于架构的重大变更,部分API和命令行参数可能会有所调整,请参考[文档](docs/zh_cn/index.md)获取最新的使用说明。
|
|
|
- - 由于模型的重大更新,用户需要重新下载模型文件,请执行`python -m mineru.models.download`命令进行模型下载。
|
|
|
+ - 包名从`magic-pdf`更改为`mineru`,同时命令行工具从`magic-pdf`更改为`mineru`,用户需要更新相关脚本和命令行调用方式。
|
|
|
+ - 移除了内置的libreoffice文档转换功能,用户需自行将office文档转换为pdf后再通过本项目解析。
|
|
|
|
|
|
|
|
|
<details>
|