当前位置：首页 > news >正文

Phi-3.5-mini-instruct_Uncensored-GGUF快速入门：10分钟在LM Studio中运行你的第一个AI助手

news 2026/6/2 4:35:16

Phi-3.5-mini-instruct_Uncensored-GGUF快速入门：10分钟在LM Studio中运行你的第一个AI助手

【免费下载链接】Phi-3.5-mini-instruct_Uncensored-GGUF项目地址: https://ai.gitcode.com/hf_mirrors/Flysky/Phi-3.5-mini-instruct_Uncensored-GGUF

Phi-3.5-mini-instruct_Uncensored-GGUF是基于Phi-3.5-mini-instruct_Uncensored模型的GGUF格式量化版本，专为本地部署设计，可通过LM Studio快速搭建高性能AI助手。本教程将帮助你在10分钟内完成从环境准备到模型运行的全流程，即使是AI新手也能轻松上手。

准备工作：下载必要文件

1. 安装LM Studio

首先访问LM Studio官方网站下载并安装最新版本的LM Studio应用程序。这是一款轻量级本地AI运行工具，支持GGUF格式模型，无需复杂配置即可快速启动对话。

2. 获取Phi-3.5-mini-instruct_Uncensored-GGUF模型

通过以下命令克隆项目仓库，获取模型文件和示例代码：

git clone https://gitcode.com/hf_mirrors/Flysky/Phi-3.5-mini-instruct_Uncensored-GGUF

仓库中包含多种量化版本的GGUF模型文件，推荐新手选择Phi-3.5-mini-instruct_Uncensored-Q4_K_M.gguf（2.39GB），平衡性能与资源占用。

模型导入：3步添加到LM Studio

1. 启动LM Studio

打开安装好的LM Studio应用，首次启动会显示模型库界面。点击左侧导航栏的"My Models"进入本地模型管理页面。

2. 导入GGUF模型文件

点击"Import Model"按钮，在文件选择器中导航至克隆的仓库目录，选择下载的GGUF模型文件（如Phi-3.5-mini-instruct_Uncensored-Q4_K_M.gguf），等待导入完成。

3. 验证模型加载状态

导入成功后，模型会显示在"My Models"列表中，状态为"Ready"。点击模型卡片即可进入对话界面，此时模型已准备就绪。

开始对话：与AI助手交互

1. 设置对话参数

在模型对话界面，可通过右侧面板调整参数：

Max Tokens：控制回复长度（建议设为200-500）
Temperature：调整随机性（0.7为平衡值，数值越高回复越灵活）
System Prompt：自定义AI助手角色（例如："你是一位耐心的技术导师，用简单语言解释复杂概念"）

2. 输入提示词并生成回复

在输入框中键入问题，例如：

解释什么是GGUF格式，它与其他模型格式有何区别？

点击"Generate"按钮，AI助手将在几秒内生成回复。首次运行可能需要5-10秒加载模型，后续对话会更快。

3. 示例对话效果

模型采用以下提示格式（无需手动输入，LM Studio会自动处理）：

<s><|system|> {system_prompt}<|end|><|user|> {prompt}<|end|><|assistant|><|end|>

例如，当系统提示设为"用简洁的语言回答"，提问"为什么天空是蓝色的？"时，AI会生成类似：

天空呈现蓝色是因为大气中的气体分子对阳光中的蓝色光散射更强，这种现象称为瑞利散射。短波长的蓝光比长波长的红光更容易被散射，因此我们看到的天空主要是蓝色的。

进阶操作：通过Python代码运行模型

如果你希望通过代码集成模型，项目提供了完整的Python示例：

1. 安装依赖

进入项目的examples目录，安装所需依赖：

cd examples pip install -r requirements.txt

依赖包括transformers、gguf等库，已配置国内镜像源加速下载。

2. 运行推理脚本

执行以下命令启动模型推理（默认使用Q4_K_L量化模型）：

python inference.py --gguf_file ../Phi-3.5-mini-instruct_Uncensored-Q4_K_M.gguf

脚本会自动加载模型并进行性能测试，输出平均推理时间和示例对话结果。日志文件保存在当前目录，命名格式为{model_name}_inference_{timestamp}.log。

模型选择指南：如何挑选合适的量化版本

项目提供多种量化级别，可根据设备配置选择：

量化类型	文件大小	推荐设备	特点
Q8_0	4.06GB	高性能PC/显卡	极高质量，接近原始模型
Q4_K_M	2.39GB	主流PC/笔记本	平衡质量与速度，推荐新手
Q3_K_M	1.96GB	低配置设备	占用资源少，适合入门体验