shniubobo acd0deb1e2 docs(web_api): Change docstrings style 9 月之前
..
Dockerfile c734f4debe refactor(web_api): Optimize `Dockerfile` 9 月之前
README.md f559fd9c36 refactor(web_api): adapt to new pipeline API changes 9 月之前
app.py acd0deb1e2 docs(web_api): Change docstrings style 9 月之前
download_models.py c734f4debe refactor(web_api): Optimize `Dockerfile` 9 月之前
entrypoint.sh c734f4debe refactor(web_api): Optimize `Dockerfile` 9 月之前
magic-pdf.json c734f4debe refactor(web_api): Optimize `Dockerfile` 9 月之前
requirements.txt c734f4debe refactor(web_api): Optimize `Dockerfile` 9 月之前

README.md

基于MinerU的PDF解析API

- MinerU的GPU镜像构建
- 基于FastAPI的PDF解析接口

支持一键启动,已经打包到镜像中,自带模型权重,支持GPU推理加速,GPU速度相比CPU每页解析要快几十倍不等

启动命令:

docker run -itd --name=mineru_server --gpus=all -p 8888:8000 quincyqiang/mineru:0.1-models

具体截图请见博客:https://blog.csdn.net/yanqianglifei/article/details/141979684

启动日志:

输入参数:

访问地址:

http://localhost:8888/docs

http://127.0.01:8888/docs

解析效果:

镜像地址:

阿里云地址:docker pull registry.cn-beijing.aliyuncs.com/quincyqiang/mineru:0.1-models

dockerhub地址:docker pull quincyqiang/mineru:0.1-models

构建方式:

  1. 拷贝hantian/layoutreader,opendatalab/PDF-Extract-Kit-1.0,paddleocr模型到当前目录。
  2. docker build --build-arg http_proxy=http://127.0.0.1:7890 --build-arg https_proxy=http://127.0.0.1:7890 -t mineru-api .