当前位置: 首页 > news >正文

从零开始微调大模型,部署智能体在网页

1.收集论文数据

从学术数据库或开放资源平台下载相关领域的PDF论文,确保数据覆盖研究主题的核心内容。常用的数据来源包括arXiv、PubMed、IEEE Xplore等。筛选高质量论文,避免重复或低相关性文献。

2.minerU转换PDF论文为Md文件

MinerU官网直接下载相应版本。

使用工具如minerU将PDF论文转换为Markdown格式,便于后续处理。确保转换后的文本保留关键信息(如标题、摘要、正文、参考文献),并清理无关内容(页眉、页脚、图表描述等)。检查格式一致性,避免转换错误。

MinerU转换为md格式

3.Easy DataSet调用ollama大模型生成问题

https://github.com/ConardLi/easy-dataset?tab=readme-ov-file可以下载APP版本,或者使用docker部署。

添加模型,可以使用购买的API或者本地部署大模型。

添加大模型

通过Easy DataSet工具调用ollama大模型,基于Markdown内容自动生成问答对。提示词需明确指定问题类型(如事实提取、推理分析等),生成后人工校验问题的准确性和多样性。

Easy DataSet导出json训练集

将生成的问答对整理为结构化JSON格式,字段包括questionanswercontext。验证数据完整性后导出。

4.在Docker容器下启动LLama微调

可采用conda或者docker部署LLama。

conda

git clone https://github.com/hiyouga/LLaMA-Factory.git conda create -n llama_factory python=3.10 -y conda activate llama_factory cd LLaMA-Factory # 临时使用清华源安装依赖(替换为你需要的安装命令) pip install -r requirements.txt --index-url https://pypi.tuna.tsinghua.edu.cn/simple

docker部署代码:

git clone --branch v0.9.3 https://github.com/hiyouga/LLaMA-Factory.git LLaMA-Factory-0.9.3 cd LLaMA-Factory\docker\docker-cuda docker-compose up –d

创建包含微调环境的Docker镜像,依赖项包括PyTorch、Transformers库等。启动容器。示例命令:

docker run --gpus all -it --rm -p 17860:17860 -v D:\LLaMA-Factory-0.9.3\data:/app/data -v D:\LLaMA-Factory-0.9.3\output:/app/output -v D:\model:/models docker-cuda-llamafactory:latest
llamafactory-cli webui
隧道转发

注意如果是集群部署,GPU计算节点访问直接访问不了,可以通过隧道转发

配置双层端口转发访问 GPU 节点 Web UI

确保 Web UI 在 c001 节点运行
在 c001 GPU节点终端确认 Web UI 服务已启动,输出类似Running on local URL: http://0.0.0.0:7860。若未运行,需先启动服务。

Xshell 隧道转发配置
打开连接至 mn01 的 Xshell 会话,进入属性设置:

  • 导航至文件属性隧道添加
  • 参数配置:
    • 类型:本地(Outgoing)
    • 源主机:127.0.0.1
    • 源端口:7860(本地映射端口)
    • 目标主机:192.168.100.1(c001 内网 IP)
    • 目标端口:7860(c001 服务端口)
      保存配置后重新连接会话以激活隧道。

本地浏览器访问
在浏览器地址栏输入http://127.0.0.1:7860,流量将通过 Xshell 隧道经 mn01 转发至 c001 的 7860 端口,实现直接访问。

技术原理
Xshell 的本地隧道功能建立了一条加密通道,将本地端口请求逐跳转发至目标内网节点,绕过管理节点的端口限制。此方法适用于集群内网服务的穿透访问,稳定性优于临时端口映射。

下载大模型

下载模型,使用pip或者git

pip install modelscope modelscope download --model deepseek-ai/DeepSeek-R1-Distill-Qwen-32B git clone https://www.modelscope.cn/deepseek-ai/DeepSeek-R1-Distill-Qwen-32B.git
加载大模型

写入存在共享盘的大模型地址加载模型。

微调大模型

在dataset_info加入file_name。

在LLama上载入数据集,调整参数开始训练。

5.导出微调模型部署

微调完成后保存模型权重和配置文件到指定目录。使用transformers库的save_pretrained方法导出模型,确保包含adapter_config.jsonpytorch_model.bin文件。验证模型性能后压缩为.tar.gz便于传输。

6.使用dify部署智能体

dify平台创建新应用,上传微调模型或通过API连接模型服务。配置智能体的名称、描述和对话流程,设置访问权限和监控指标。测试智能体响应质量后发布,获取API端点或嵌入代码。

7.在网站前端嵌入代码

http://www.gsyq.cn/news/1539946.html

相关文章:

  • Qwen3.6-Plus+Qdrant替代OpenAI全家桶实战
  • 10分钟打造惊艳作品集:Next.js + 3D动画的终极实战指南
  • 代理记账机构价格大揭秘,常州中顺会计很透明 - mypinpai
  • 终极指南:3步修复Android设备Google Play Integrity验证问题
  • 颠覆传统研究模式:3步构建你的本地智能研究助手
  • 桌面自动化总踩坑?OpenClaw 完整部署流程把各类拦截问题讲透
  • NXP IW612三频无线芯片:如何从硬件根源终结智能家居协议割据?
  • Obsidian Outliner拖拽功能深度解析:事件监听机制与数据结构优化实现
  • org-ai 语音功能详解:让 Emacs 支持语音输入输出的完整配置教程
  • 计算机Java毕设实战-基于 SpringBoot 的员工 / 学生查勤考核系统设计与研究 轻量化线上查勤信息管理系统的设计与研究【完整源码+LW+部署说明+演示视频,全bao一条龙等】
  • 2026年有实力的软体家具源头厂家推荐 - mypinpai
  • 2026年最新行业整理,国内知名的插座式滤波器工厂都有哪些
  • 专为AI研究设计的浏览器安卓模拟器,内置28个模拟应用和416个任务模板,单机可并行256个实例
  • Wan2.2:5分钟看懂如何用消费级显卡生成720P电影级视频
  • 2026年绍兴大学成人教育服务口碑机构推荐 - mypinpai
  • 高效智能的原神自动化助手:让程序替你玩游戏的完整解决方案
  • ARP代理--工作原理
  • GPT-4结构化输出实战:JSON Schema与多模态工作流嵌入指南
  • 双核心可控释能圈层能源系统完整技术(期待有能力的人进行研发)
  • 2026年碾米机行业口碑甄选:多家靠谱厂商横向对比与案例解析 - 优质品牌商家
  • 2026年通风降温厂家选购指南:厂房/车间/工厂/仓库通风降温设备厂家、冷风机厂家选择指南,产能、工艺、品控三维度权威解析 - 海棠依旧大
  • 5款实用的监控管理电脑软件推荐:实时监控管理电脑的神器,个个都实用
  • Subnautica Nitrox多人联机模组:终极指南带你告别孤独深海探险
  • 2026 远程桌面软件横评:连连控、ToDesk、向日葵深度对比
  • YTPro与其他YouTube客户端对比:功能、性能与兼容性全面分析
  • 生物医药→生物兽药→生物农药:这三个赛道的本质是同一个技术平台
  • 2026年控制柜升级改造公司怎么选?这份官方甄选指南请收好 - 优质品牌商家
  • 2026年武汉漏水检测公司选购指南:暗管/地埋管道/消防管道漏水检测、查漏水点服务商选择指南,产能、工艺、品控三维度解析 - 海棠依旧大
  • 2026年软磁不锈钢材料行业观察:铁磁性研磨棒供应商多维实力对比与甄选指南 - 优质品牌商家
  • [智能体-437]:英伟达链(NVIDIA 全产业链)完整详解