hace 1 mes · a4cac624df
--- a/mineru/backend/vlm/vlm_analyze.py
+++ b/mineru/backend/vlm/vlm_analyze.py
@@ -43,6 +43,16 @@ class ModelSingleton:
 
				             batch_size = 0
			
 
				             if backend in ['transformers', 'vllm-engine', "vllm-async-engine"] and not model_path:
			
 
				                 model_path = auto_download_and_get_model_root_path("/","vlm")
			
 
				+                import torch
			
 
				+                compute_capability = 0.0
			
 
				+                custom_logits_processors = False
			
 
				+                if torch.cuda.is_available():
			
 
				+                    major, minor = torch.cuda.get_device_capability()
			
 
				+                    compute_capability = float(major) + (float(minor) / 10.0)
			
 
				+                    logger.info(f"compute_capability: {compute_capability}")
			
 
				+                if compute_capability >= 8.0:
			
 
				+                    custom_logits_processors = True
			
 
				+
			
 
				                 if backend == "transformers":
			
 
				                     try:
			
 
				                         from transformers import (
			
@@ -96,7 +106,7 @@ class ModelSingleton:
 
				                         kwargs["gpu_memory_utilization"] = 0.5
			
 
				                     if "model" not in kwargs:
			
 
				                         kwargs["model"] = model_path
			
 
				-                    if version.parse(vllm_version) >= version.parse("0.10.1") and "logits_processors" not in kwargs:
			
 
				+                    if custom_logits_processors and version.parse(vllm_version) >= version.parse("0.10.1") and "logits_processors" not in kwargs:
			
 
				                         kwargs["logits_processors"] = [MinerULogitsProcessor]
			
 
				                     # 使用kwargs为 vllm初始化参数
			
 
				                     vllm_llm = vllm.LLM(**kwargs)
			
@@ -112,7 +122,7 @@ class ModelSingleton:
 
				                         kwargs["gpu_memory_utilization"] = 0.5
			
 
				                     if "model" not in kwargs:
			
 
				                         kwargs["model"] = model_path
			
 
				-                    if version.parse(vllm_version) >= version.parse("0.10.1") and "logits_processors" not in kwargs:
			
 
				+                    if custom_logits_processors and version.parse(vllm_version) >= version.parse("0.10.1") and "logits_processors" not in kwargs:
			
 
				                         kwargs["logits_processors"] = [MinerULogitsProcessor]
			
 
				                     # 使用kwargs为 vllm初始化参数
			
 
				                     vllm_async_llm = AsyncLLM.from_engine_args(AsyncEngineArgs(**kwargs))
			
--- a/mineru/model/vlm_vllm_model/server.py
+++ b/mineru/model/vlm_vllm_model/server.py
@@ -1,5 +1,7 @@
 
				 import sys
			
 
				 
			
 
				+from loguru import logger
			
 
				+
			
 
				 from mineru.utils.models_download_utils import auto_download_and_get_model_root_path
			
 
				 
			
 
				 from vllm.entrypoints.cli.main import main as vllm_main
			
@@ -37,6 +39,16 @@ def main():
 
				         for index in sorted(model_arg_indices, reverse=True):
			
 
				             args.pop(index)
			
 
				 
			
 
				+    import torch
			
 
				+    compute_capability = 0.0
			
 
				+    custom_logits_processors = False
			
 
				+    if torch.cuda.is_available():
			
 
				+        major, minor = torch.cuda.get_device_capability()
			
 
				+        compute_capability = float(major) + (float(minor) / 10.0)
			
 
				+        logger.info(f"compute_capability: {compute_capability}")
			
 
				+    if compute_capability >= 8.0:
			
 
				+        custom_logits_processors = True
			
 
				+
			
 
				     # 添加默认参数
			
 
				     if not has_port_arg:
			
 
				         args.extend(["--port", "30000"])
			
@@ -44,7 +56,7 @@ def main():
 
				         args.extend(["--gpu-memory-utilization", "0.5"])
			
 
				     if not model_path:
			
 
				         model_path = auto_download_and_get_model_root_path("/", "vlm")
			
 
				-    if not has_logits_processors_arg and version.parse(vllm_version) >= version.parse("0.10.1"):
			
 
				+    if not has_logits_processors_arg and custom_logits_processors and version.parse(vllm_version) >= version.parse("0.10.1"):
			
 
				         args.extend(["--logits-processors", "mineru_vl_utils:MinerULogitsProcessor"])
			
 
				 
			
 
				     # 重构参数，将模型路径作为位置参数