Преглед на файлове

fix: 更新vLLM守护进程脚本中的数据并行配置,调整为支持2个GPU

zhch158_admin преди 1 месец
родител
ревизия
8b856eeef1
променени са 1 файла, в които са добавени 4 реда и са изтрити 3 реда
  1. 4 3
      zhch/vllm_daemon.sh

+ 4 - 3
zhch/vllm_daemon.sh

@@ -17,7 +17,8 @@ MODEL_NAME="DotsOCR"
 
 # GPU 配置
 GPU_MEMORY_UTILIZATION="0.70"
-DATA_PARALLEL_SIZE="3"  # 3个GPU
+CUDA_VISIBLE_DEVICES="1,2"
+DATA_PARALLEL_SIZE="2"  # 3个GPU
 MAX_MODEL_LEN="32768"
 MAX_NUM_BATCHED_TOKENS="32768"
 MAX_NUM_SEQS="16"
@@ -108,7 +109,7 @@ start() {
     fi
     
     # 启动vLLM服务
-    nohup vllm serve $HF_MODEL_PATH \
+    nohup $CUDA_VISIBLE_DEVICES; vllm serve $HF_MODEL_PATH \
         --host $HOST \
         --port $PORT \
         --gpu-memory-utilization $GPU_MEMORY_UTILIZATION \
@@ -347,4 +348,4 @@ case "$1" in
         usage
         exit 1
         ;;
-esac
+esac