Java知识分享网 - 轻松学习从此开始!    

Java知识分享网

        
AI编程,程序员挑战年入30~100万高级指南 - 职业规划
SpringBoot+SpringSecurity+Vue权限系统高级实战课程        

IDEA永久激活

Java微信小程序电商实战课程(SpringBoot+VUe)

     

AI人工智能学习大礼包

     

PyCharm永久激活

66套java实战课程无套路领取

     

Cursor+Claude AI编程 1天快速上手视频教程

     
当前位置: 主页 > Java文档 > 人工智能AI >

VLLM、LMdeploy模型部署 PDF 下载


时间:2026-01-18 10:20来源:http://www.java1234.com 作者:转载  侵权举报
VLLM、LMdeploy模型部署
失效链接处理
VLLM、LMdeploy模型部署 PDF 下载

 
 
相关截图:
 
主要内容:
 
1.Vllm 先安装环境需求:
 
conda init
conda create -n vllm python=3.12 -y
conda env list
conda activate vllm
pip install vllm
pip install modelscope
下载模型
modelscope download --model deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B --local_dir
/root/autodl-tmp/model
modelscope download --model Qwen/Qwen3-0.6B --local_dir /root/autodltmp/qwen_model
vLLM运行大模型
sh命令:
vllm serve /root/autodl-tmp/model/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B
vllm serve /root/autodl-tmp/qwen_model/Qwen/Qwen3-0.6B

 

vllm serve /root/autodl-tmp/model --api-key 12345 --served-model-name qwen --port
6006 --max-model-len 2048 --max-num-seqs 96
vllm serve /root/autodl-tmp/train_data/1.5b \
--api-key 12345 \
--served-model-name qwen \
--port 6006 \
--tensor-parallel-size 2 \
--max-model-len 2048 \
--max-num-seqs 96 \
--max-num-batched-tokens 8192 \
--gpu-memory-utilization 0.85 \
--enable-prefix-caching \
--disable-custom-all-reduce \
--disable-log-requests
ps aux
kill -9



 


------分隔线----------------------------


锋哥推荐