当前位置: 首页 > news >正文

如何在算力云上部署Qwen/Qwen3-8B

注册算力云账号

访问AutoDL算力云官网完成账号注册流程。平台提供多种GPU算力租赁方案,注册后可通过实名认证提升账号权限。

购买算力云服务

登录后进入控制台,选择符合需求的GPU实例规格(如显存大小、显卡型号)。注意选择适合大模型训练的配置,通常需要16GB以上显存。付款后等待实例初始化完成。

连接服务器

使用SSH工具(如Tabby、MobaXterm)连接分配的服务器IP。连接信息在实例详情页可见,需使用提供的登录密码或密钥文件。首次连接建议创建模型存储目录:

mkdir -p /root/autodl-tmp/models

准备模型下载环境

安装必要的Python库,建议创建虚拟环境:

pip install modelscope torch

配置下载脚本

创建download.py文件,以下载Qwen2.5-Omni-3B为例:

from modelscope import snapshot_download # 可选模型,按需取消注释切换 # model_dir = snapshot_download('ZhipuAI/glm-4-9b-chat', cache_dir='/root/autodl-tmp/models', revision='master') # model_dir = snapshot_download('deepseek-ai/DeepSeek-R1-Distill-Qwen-7B', cache_dir='/root/autodl-tmp/models', revision='master') # model_dir = snapshot_download('LLM-Research/Meta-Llama-3.1-8B-Instruct', cache_dir='/root/autodl-tmp/models', revision='master') # model_dir = snapshot_download('Qwen/Qwen2.5-7B-Instruct', cache_dir='/root/autodl-tmp/models', revision='master') # model_dir = snapshot_download('LLM-Research/Meta-Llama-3.1-8B-Instruct') model_dir = snapshot_download('Qwen/Qwen3-8B', cache_dir='/root/autodl-tmp/models', revision='master') # 当前下载模型 Qwen2.5-Omni-3B #model_dir = snapshot_download('Qwen/Qwen2.5-Omni-3B', cache_dir='/root/autodl-tmp/models', revision='master') print(f"模型下载完成,存放路径:{model_dir}")

执行下载命令

运行脚本并监控下载进度:

python download.py

下载过程中会显示进度条,完成时输出模型存储路径。若需切换模型,修改脚本中的模型ID即可。

验证下载结果

检查模型文件是否完整:

ls -lh /root/autodl-tmp/models/Qwen/Qwen2.5-Omni-3B

正常应包含config.jsonpytorch_model.bin等核心文件。若下载中断,重新运行脚本会自动续传。

部署vLLM推理服务

安装vLLM推理框架:

pip install vllm

验证服务是否安装:

python -c "import torch; print(torch.__version__); print(torch.cuda.is_available())"

启动推理服务

启动Qwen3-8B推理服务(支持工具调用):

python -m vllm.entrypoints.openai.api_server \ --model /root/autodl-tmp/models/Qwen/Qwen3-8B \ --served-model-name qwen3-8b \ --max-model-len 8k \ --host 0.0.0.0 \ --port 6006 \ --dtype bfloat16 \ --gpu-memory-utilization 0.8 \ --enable-auto-tool-choice \ --tool-call-parser hermes \ --enable-reasoning \ --reasoning-parser deepseek_r1

虚拟环境版安装(推荐)

  1. 新建并激活虚拟环境(仅第一次执行):
python -m venv ~/autodl-tmp/venv-llm source ~/autodl-tmp/venv-llm/bin/activate
  1. 一键安装全套依赖:
pip install vllm modelscope torch transformers accelerate -i https://pypi.tuna.tsinghua.edu.cn/simple
  1. 校验vLLM新版本是否支持reasoning参数:
python -m vllm.entrypoints.openai.api_server -h | grep reasoning
  1. 启动完整带思维链的服务:
python -m vllm.entrypoints.openai.api_server \ --model /root/autodl-tmp/models/Qwen/Qwen3-8B \ --served-model-name qwen3-8b \ --max-model-len 8k \ --host 0.0.0.0 \ --port 6006 \ --dtype bfloat16 \ --gpu-memory-utilization 0.8 \ --enable-auto-tool-choice \ --tool-call-parser hermes \ --enable-reasoning \ --reasoning-parser deepseek_r1

本地访问服务

服务启动后,可通过以下方式测试:

curl http://localhost:6006/v1/chat/completions \ -H "Content-Type: application/json" \ -d '{ "model": "qwen3-8b", "messages": [ {"role": "user", "content": "你好"} ] }'
http://www.gsyq.cn/news/1644908.html

相关文章:

  • 嵌入式6DoF运动跟踪:IIM-42652与PIC18F87J50实战
  • 5分钟掌握B站视频下载器:免费获取大会员4K与充电专属内容完整指南
  • 告别风扇噪音!Fan Control让你的Windows电脑静音又凉爽的完整指南
  • SELinux 深度解析:从核心原理到运维实战的完整指南
  • 逆向阿里V2滑块验证码:从环境检测到轨迹加密的完整实战
  • 060、超分数据集构建:从 DIV2K 到 REDS 的数据预处理与增强方法
  • Chatbox桌面AI助手实战指南:构建个人智能工作站的最佳实践
  • 如何在macOS上完美使用Xbox控制器:360Controller驱动终极解决方案
  • 英雄联盟自动化工具箱:三分钟告别繁琐操作,专注游戏核心体验
  • Agent开发本质是CRUD编排:状态建模与执行层工程实践
  • 暗黑破坏神2存档修改终极指南:免费Web编辑器d2s-editor完全解析
  • Linux 5.15 网口驱动调试:从 PHY 初始化到 DMA 异常的 5 步硬件排查法
  • 5分钟解锁Wand高级功能:开源增强工具完整指南
  • 3分钟免费解锁B站缓存视频:m4s-converter终极完整指南
  • 使用 Oracle EBS 的中国企业Oracle EBS在中国金融、电信、能源等行业有大量深度用户,尤其在银行和保险行业占据主导地位。金融行业(银行)这是Oracle EBS在中国最集中的用户
  • 暑假40天极速学Python!大学生零基础保姆级上岸路线(从入门到可做项目)
  • E-Ink Launcher:为电子阅读器打造的极致省电Android启动器
  • Palworld存档转换工具:三步实现游戏数据自由编辑
  • YOLO目标检测从入门到精通:核心原理、版本演进与实战部署指南
  • VisualCppRedist AIO:Windows运行库问题的终极一站式解决方案
  • Linux应急响应实战指南:从入侵检测到系统加固的完整流程
  • BigQuery新手实战指南:从数据导入到高效查询避坑全解析
  • Visual C++运行时库终极指南:3步搞定Windows软件依赖问题
  • 5分钟学会:智能获取国家中小学智慧教育平台电子课本的完整指南
  • d2s-editor暗黑破坏神2存档编辑器实战手册:可视化修改与高效存档管理深度指南
  • AI 文案语气控制:风格滑块背后要有可验证标准
  • 如何用FanControl打造智能静音电脑:从零基础到专业调校的完整指南
  • 5分钟掌握音乐解锁:让加密音频重获播放自由的终极方案
  • 2026年中新赛克嵌入式岗位面试题带参考答案
  • Databricks API生产级实践:认证、作业、集群与DBFS四大模块深度解析