当前位置: 首页 > news >正文

[智能体-24]:ollama运行deepseek大模型的方法示例

下面给你一套完整、可直接照着做的示例:用 Ollama 安装并运行 DeepSeek(R1 推理版 / Coder 代码版),包括命令行、API、WebUI、离线导入四种方式,以及常见坑的处理。


一、先确认:Ollama 里有哪些 DeepSeek 可用

主要两大类:

  • deepseek-r1:通用 + 推理强(数学 / 逻辑 / 解题)
    • deepseek-r1:1.5b≈1.1GB,低配也能跑
    • deepseek-r1:7b≈4.7GB,主流显卡(6GB+)
    • deepseek-r1:8b≈5.2GB,推荐日常用
    • deepseek-r1:14b≈8–12GB,建议 16GB 显存
  • deepseek-coder:代码专用
    • deepseek-coder:6.7b

新手推荐:deepseek-r1:8b(平衡速度 / 效果 / 资源)


二、方式 1:命令行直接运行(最简单)

1)安装 / 启动 Ollama(已装可跳过)

  • Windows:官网下载安装包,安装后自动后台运行
  • macOS:

bash

运行

brew install ollama ollama serve
  • Linux:

bash

运行

curl -fsSL https://ollama.com/install.sh | sh sudo systemctl start ollama sudo systemctl enable ollama

2)拉取 DeepSeek 模型

bash

运行

# 推荐:8B 通用推理版 ollama pull deepseek-r1:8b # 低配/测试:1.5B ollama pull deepseek-r1:1.5b # 代码专用 ollama pull deepseek-coder:6.7b

3)运行并对话

bash

运行

ollama run deepseek-r1:8b

出现>>>即可聊天:

plaintext

>>> 用数学方法解释为什么 0.999... = 1 >>> 写一个 Python 快速排序

退出:/bye

4)常用管理命令

bash

运行

ollama list # 查看已下载模型 ollama ps # 查看正在运行的模型 ollama stop deepseek-r1:8b # 停止模型 ollama rm deepseek-r1:8b # 删除模型

三、方式 2:REST API 调用(程序 / 脚本用)

Ollama 默认开11434端口,兼容 OpenAI 格式。

1)curl 示例

bash

运行

curl http://localhost:11434/api/chat -d '{ "model": "deepseek-r1:8b", "messages": [ {"role": "user", "content": "解释一下什么是大语言模型"} ], "stream": false }'

2)Python 示例

python

运行

import requests url = "http://localhost:11434/api/generate" payload = { "model": "deepseek-r1:8b", "prompt": "用Python写一个斐波那契函数", "stream": False } res = requests.post(url, json=payload) print(res.json()["response"])

四、方式 3:WebUI 可视化(推荐日常使用)

Open WebUI为例(功能最全)。

1)Docker 启动 Open WebUI

bash

运行

docker run -d \ -p 3000:3000 \ -v open-webui:/app/backend/data \ --add-host=host.docker.internal:host-gateway \ ghcr.io/open-webui/open-webui:main

2)浏览器访问

打开:http://localhost:3000

  • 首次注册 / 登录
  • 右上角选模型:deepseek-r1:8b
  • 直接对话、保存会话、调整参数

五、方式 4:离线导入 GGUF(解决超时 / 境外下载慢)

适合:网络差、拉取超时、想自己用 GGUF 模型。

1)国内下载 GGUF

去魔搭 ModelScope 或 HF 镜像站,搜索:

  • DeepSeek-R1-Distill-Qwen-8B-GGUF
  • 下载Q4_K_M(平衡速度 / 精度)

2)写 Modelfile

新建文件Modelfile(无后缀):

plaintext

FROM ./DeepSeek-R1-Distill-Qwen-8B.Q4_K_M.gguf PARAMETER temperature 0.6 PARAMETER num_ctx 16384 SYSTEM "你是 DeepSeek 推理模型,擅长数学和代码,回答简洁准确。"

3)本地创建模型

bash

运行

ollama create deepseek-r1:8b-local -f Modelfile

4)运行

bash

运行

ollama run deepseek-r1:8b-local

六、常见问题(国内用户必看)

1)pull 超时 / 慢

  • 用国内镜像:OLLAMA_MIRROR=https://ollama.ac.cn

bash

运行

# Linux/macOS export OLLAMA_MIRROR=https://ollama.ac.cn ollama pull deepseek-r1:8b
  • 或直接用上面 “离线 GGUF 导入” 方法

2)显存不够

  • 优先用1.5B/7B/8B量化版(Q4_K_M)
  • 关闭其他占用显存的程序

3)想做代码专用

bash

运行

ollama pull deepseek-coder:6.7b ollama run deepseek-coder:6.7b
http://www.gsyq.cn/news/1355117.html

相关文章:

  • 降AIGC黑科技!AI率92%暴降至5%!实测10款降AIGC平台!学生党狂喜!
  • AFM虚拟实验避坑指南:PID参数怎么调?相位图为何比形貌图更“敏感”?
  • 决策树可解释性幻觉:路径爆炸、规则漂移与特征幻觉的工程破解
  • 2026年宁夏银川GEO优化与AI推广服务商深度横评|精准获客完全指南 - 精选优质企业推荐官
  • Video2X:让模糊视频变清晰的AI魔法工具,完全免费!
  • 【小白专属详细教程】Windows 11 平台 OpenClaw 一键部署完整操作流程(包含安装包)
  • 5分钟快速上手:BepInEx游戏扩展框架完全指南
  • Jupyter Server路径遍历漏洞CVE-2024-28179深度解析
  • 2026年宁夏企业AI推广与GEO优化完全指南:银川、石嘴山、吴忠、中卫、固原五地获客破局方案 - 精选优质企业推荐官
  • 【办公小助手】OpenClaw 对接 DeepSeek 模型配置详细教程(包含安装包)
  • 终极AMD处理器性能优化指南:深度掌握Ryzen SDT调试工具
  • 3个步骤:如何在Windows 11上实现Android应用无缝安装与管理
  • 2026武汉代理记账公司哪家好?十大靠谱公司注册代办财税机构推荐指南(全行业适配) - 品牌智鉴榜
  • BBB Video Exporter社区贡献指南:如何参与开源项目开发
  • 在Taotoken模型广场中根据任务与预算选择合适的AI模型
  • 3步解锁CPU隐藏性能:CPUDoc智能调度实战指南
  • 双指针算法习题解答
  • ViGEmBus:Windows游戏控制器兼容性的终极解决方案
  • 容器镜像加速实战:3种方案彻底解决国内拉取难题
  • 灵活退改机票哪个平台政策宽松?美团机票出行更有保障 - 博客万
  • 5分钟掌握QQ音乐音频解密:qmcdump让加密音乐自由播放
  • 3步掌握Windows字体优化:Better ClearType Tuner完整使用指南
  • 行程不确定订机票,哪个平台退改更省心靠谱? - 博客万
  • Windows安卓应用安装终极指南:告别模拟器的完整解决方案
  • 技能技术框架:Awesome Agent Skills技术路线图与创新框架
  • 终极指南:深度解析Ryzen SDT调试工具的技术原理与实战应用
  • CD55和CD97:癌症治疗研究新兴靶点
  • 终极iOS庆祝效果指南:SAConfettiView的5种纸屑类型与自定义技巧
  • 如何在Windows上进行高效屏幕标注?ppInk免费开源工具完全指南
  • 3个场景化应用揭秘:MobaXterm中文版如何成为远程管理的瑞士军刀