当前位置：首页 > news >正文

Ollama本地部署大模型

news 2026/6/10 23:44:48

说明

本文是我于2025-05-31在某SDN上发布的，但是即使是这样一篇简单基础甚至有点简陋的文章在原平台也是经常“被付费观看”，于是我决定还是在博客园这也同步发布，希望能给大家带来一点帮助。

安装

1.下载ollama并进行安装

前往Ollama官方网站下载

2.检查是否安装成功

ollama -v

3.路径迁移（可选）

因为Ollama默认安装到C盘了，下载的模型也会默认放C盘，所以我更改了软件和模型存放位置，新位置在 D:\Software\Ollama\models。

按照路径找到软件安装文件夹和模型存放文件夹，然后一起剪切到目标文件夹。

默认的安装目录：

C:\Users\%username%\AppData\Local\Programs\Ollama

如果安装了模型，模型默认目录：

C:\Users\%username%\.ollama\models

4.修改环境变量（可选）

进入此电脑文件夹，右键选择属性，选择高级系统设置，修改用户变量和系统变量。

修改用户变量中的Path，将ollama软件位置修改到新的位置。

如果你也改了位置，则改动后可以将环境变量中旧的位置删掉，同时可以把旧位置的Ollama和模型也删了。

注：若删掉原来的路径，则将不能自动启动，且需要修改原来快捷方式的路径和图标。

在用户变量中添加：

OLLAMA_HOST 为 0.0.0.0OLLMA_ORIGINS　为　＊

如下图：

在系统变量中添加：

OLLAMA_MODELS 为 D:\Software\Ollama\models

如下图：

然后重启计算机。

Ollama其他环境变量列表：

此部分参考的是知乎AiBot的文章Ollama 安装与配置与添加模型。

OLLAMA_HOST：这个变量定义了Ollama监听的网络接口。通过设置参数值为 0.0.0.0，我们可以让Ollama监听所有可用的网络接口，从而允许外部网络访问。如果你想让内网其他机器访问你的Ollama服务，这个很重要！

Windows (PowerShell): $env:OLLAMA_HOST="0.0.0.0:11434" (注意: 0.0.0.0 表示监听所有网络接口)
Linux/macOS: export OLLAMA_HOST="0.0.0.0:11434"
别忘了在防火墙里放行11434端口（或者你自定义的端口）！

OLLAMA_MODELS：这个变量指定了模型镜像的存储路径。通过设置参数值为新模型所在路径，如E:\ollama\models，我们可以将模型镜像存储在E盘，避免C盘空间不足的问题。
OLLAMA_KEEP_ALIVE：这个变量控制模型在内存中的存活时间。设置参数值为24h可以让模型在内存中保持24小时，提高访问速度。
OLLAMA_PORT：这个变量允许我们更改Ollama的默认端口。例如，设置参数值为8080可以将服务端口从默认的11434更改为8080。
OLLAMA_NUM_PARALLEL：这个变量决定了Ollama可以同时处理的用户请求数量。设置参数值为4可以让Ollama同时处理两个并发请求。
OLLAMA_MAX_LOADED_MODELS：这个变量限制了Ollama可以同时加载的模型数量。设置参数值为4可以确保系统资源得到合理分配。
OLLAMA_ORIGINS: 允许的源列表，星号*或使用逗号分隔。

8.代理设置 (内网环境经常遇到):如果你的网络需要通过代理才能访问外网，一定要设置HTTP/HTTPS代理！否则Ollama可能无法下载模型。

Windows (PowerShell):
$env:HTTP_PROXY="http://your-proxy-server:port"
$env:HTTPS_PROXY="http://your-proxy-server:port"Linux/macOS:
export HTTP_PROXY="http://your-proxy-server:port"
export HTTPS_PROXY="http://your-proxy-server:port"

使用

5.启动Ollama

双击刚才修改的快捷方式启动，或者进入Ollama文件夹双击ollama app.exe启动。

启动成功后，ollama 将在本地 11434 端口启动一个 API 服务。

6.拉取模型

通过Ollama模型市场获取模型拉取命令。

ollama pull deepseek-r1:1.5b

7.Ollama本地运行一个大模型

上面已经拉取了一个模型到本地，那么我们可以运行：

ollama run deepseek-r1:1.5b

简单的运行模型并通过命令行窗口进行对话。

如果需要可视化界面或者使用RAG增强，可以使用像AnythingLLM或者其他软件 | 插件实现，这里就不再展开。

8.Ollama命令以及作用

ollama serve         #启动ollama
ollama create        #从模型文件创建模型
ollama show          #显示模型信息
ollama run           #运行模型
ollama pull          #从注册表中拉取模型
ollama push          #将模型推送到注册表
ollama list          #列出模型
ollama cp            #复制模型
ollama rm            #删除模型
ollama help          #获取有关任何命令的帮助信息  
ollama ps            #查看运行模型及其占用
ollama run model_name --verbose  #模型运行中提供tokens数据（模型运行快慢的指标）

查看全文

http://www.gsyq.cn/news/132590.html