Procházet zdrojové kódy

fix: 更新vLLM守护进程脚本中的数据并行配置,调整为支持2个GPU

zhch158_admin před 1 měsícem
rodič
revize
8b856eeef1
1 změnil soubory, kde provedl 4 přidání a 3 odebrání
  1. 4 3
      zhch/vllm_daemon.sh

+ 4 - 3
zhch/vllm_daemon.sh

@@ -17,7 +17,8 @@ MODEL_NAME="DotsOCR"
 
 # GPU 配置
 GPU_MEMORY_UTILIZATION="0.70"
-DATA_PARALLEL_SIZE="3"  # 3个GPU
+CUDA_VISIBLE_DEVICES="1,2"
+DATA_PARALLEL_SIZE="2"  # 3个GPU
 MAX_MODEL_LEN="32768"
 MAX_NUM_BATCHED_TOKENS="32768"
 MAX_NUM_SEQS="16"
@@ -108,7 +109,7 @@ start() {
     fi
     
     # 启动vLLM服务
-    nohup vllm serve $HF_MODEL_PATH \
+    nohup $CUDA_VISIBLE_DEVICES; vllm serve $HF_MODEL_PATH \
         --host $HOST \
         --port $PORT \
         --gpu-memory-utilization $GPU_MEMORY_UTILIZATION \
@@ -347,4 +348,4 @@ case "$1" in
         usage
         exit 1
         ;;
-esac
+esac