当前位置: 首页 > news >正文

AI Agent术语大揭秘:从底层模型到完整系统,一篇读懂!

本文深入探讨了AI Agent领域的核心概念,包括Model(模型)、Scaffolding(脚手架)、Harness(执行系统)、Agent(智能体)、Context Engineering(上下文工程)、Policy(策略)、Tool Use(工具使用)、Skills(技能)和Sub-agents(子智能体),以及RL Environment(强化学习环境)、Trainer(训练器)、Rollout(试运行)和Reward(奖励机制)等训练侧概念。文章旨在帮助读者理解这些术语在AI Agent系统中的位置和作用,从而更准确地判断和比较不同AI Agent产品的能力,而不仅仅是关注底层模型。


一个领域发展太快的时候,术语往往会先跑起来,共识反而慢半拍。

AI Agent 现在就是这样。

Model、Scaffolding、Harness、Agent、Context Engineering、Policy、Tool Use、Skills、Sub-agents……这些词在文章、产品文档和社区讨论里频繁出现,但它们有时指向不同层级,有时又被混着使用。结果是:你明明知道大家都在聊 Agent,却很难判断他们到底在说模型、产品、工具调用,还是一整套执行系统。

这篇文章不做术语表,也不追求给每个词下一个绝对标准的定义。更实际的目标是:把几个最容易混淆的概念放回它们该在的位置。理解这些位置以后,再看 Claude Code、Codex、Cursor 这类工具,就不会只停留在“底层模型是什么”这一层。

整篇会按两部分展开。

第一部分是使用侧:Model、Scaffolding、Harness、Agent、Context Engineering、Policy、Tool Use、Skills、Sub-agents。它们决定一个 Agent 工具是怎么跑起来、怎么使用工具、怎么管理上下文、怎么把任务持续推进的。

第二部分是训练侧:RL Environment、Trainer、Rollout、Reward。普通用户不需要深入算法,但知道这些词的大意,有助于理解 Agent 为什么不只是“最后回答对不对”,而是要看一整轮任务里的行为过程。

Model:模型只是最里面的一层

Model 就是我们常说的大语言模型,比如 GPT、Claude、Qwen、Kimi、DeepSeek。

它的基本能力很明确:输入文字,输出文字。

这一点看起来简单,但很关键。模型本身没有自动循环,也不会真的执行外部动作。它可以在回答里表达“我需要读文件”“我想调用工具”,但真正去读文件、调用工具、把结果带回来继续下一步,并不是模型单独完成的。

所以,一个 Agent 产品不等于一个模型。

模型是核心能力,但不是完整系统。很多产品即使用相近的底层模型,体验也可能差很多,因为模型外面还包着提示词、工具、上下文管理、执行循环、权限边界等一整套东西。

Scaffolding:让模型知道如何工作的结构

Scaffolding 通常翻译成“脚手架”。

如果只看中文,这个词会有点抽象。更准确地说,它指的是模型周围那层定义行为的结构:系统提示词、工具说明、输出格式、解析规则、上下文管理方式,以及模型在多步任务中需要遵守的工作方式。

它不是模型本身,但会深刻影响模型的表现。

比如同一个模型,放在普通聊天窗口里,它可能只是回答问题;放在一个写作工作流里,它会先读材料、判断受众、控制语气、检查标题;放在一个代码 Agent 里,它会读文件、规划修改、运行测试、根据报错继续调整。

这些差异不完全来自模型能力,而来自脚手架对“模型应该怎么看世界、怎么行动”的设定。

所以,Scaffolding 可以理解为:让模型进入某种工作状态的结构。

Harness:真正让 Agent 跑起来的执行系统

Harness 是这组词里最容易混淆的一个。

直译成“线束”没有太大帮助。在 Agent 语境里,把它理解成“执行系统”更清楚。

如果说 Scaffolding 定义了模型如何工作,那么 Harness 负责让整个过程真的跑起来。它会调用模型,接住模型发出的工具调用,路由到正确的工具,把工具结果放回上下文,并决定任务要不要继续。

举个简单过程:

模型说要读一个文件,Harness 负责真的读取文件;模型根据文件内容提出修改,Harness 负责执行修改;修改后需要跑测试,Harness 再把测试结果交回模型,让模型判断下一步。

这也是很多 Agent 产品差异很大的地方。

有些执行系统很激进,拿到任务就一路做下去;有些执行系统更保守,会先读上下文、列计划、遇到风险停下来问人。有些产品工具很多,但调度混乱;有些工具不多,但停止条件和错误处理做得更稳。

所以讨论 Agent 时,不能只问模型强不强,还要看 Harness 设计得好不好。

Agent:重点是“循环”,不是“会聊天”

Agent 这个词最早来自强化学习。最基础的结构是:接收 observation(观察结果),输出 action(动作),环境根据这个动作返回新的 observation,然后继续循环。

这个“观察—动作—新观察”的循环,是理解 Agent 的关键。

在大语言模型产品里,Agent 的含义扩大了:它不只是一个模型,而是模型加上外部结构以后,形成的一套能行动的系统。它可以接收信息,决定下一步,调用工具,看到结果,再继续行动。

普通聊天窗口通常是你问一句,它答一句。Agent 则更像一个能持续处理任务的系统。

比如代码 Agent 会先读文件,再修改代码,再运行测试,再根据报错继续修。每一步都有新的观察结果,每一步都会影响下一步动作。这个循环跑起来,才是 Agent 和普通问答最核心的区别。

Context Engineering:决定模型每一步看见什么

Context Engineering 是上下文工程。

它关心的问题是:模型在每一次调用时,应该看到哪些信息。

系统提示词、工具说明、历史对话、文件内容、搜索结果、工具返回值、长期记忆,都可能进入上下文。放少了,模型不知道前因后果;放多了,模型会被噪音干扰;放错了,模型可能沿着错误方向继续推理。

这也是为什么现在很多 Agent 工具越来越重视规则文件、项目记忆、Skill、任务卡和检索策略。它们本质上都在解决同一个问题:让模型在合适的时刻看到合适的信息。

上下文工程不是一次性配置。Agent 每推进一步,前面的工具结果、错误信息、用户补充、文件变化,都会影响下一轮模型调用。Harness 需要持续管理这些内容。

短期记忆和长期记忆也属于这个范围。短期记忆是本轮任务里的对话和工具结果;长期记忆则存在外部,需要时再取回来放进上下文。

Policy:Agent 的行为策略

Policy 可以翻译成行为策略。

它描述的是 Agent 在不同情况下倾向于怎么行动。

遇到报错,是先查日志还是直接改代码?遇到不确定,是停下来问人还是自己猜?遇到危险操作,是继续执行还是请求确认?这些都属于行为策略。

在 LLM 系统里,Policy 一部分来自模型本身,一部分来自外部结构。提示词、工具、权限、记忆、停止条件、错误处理规则,都会影响 Agent 的行为。

这也是为什么同一个模型,换一个产品或一套规则,做事风格会变得很不一样。

需要注意的是,Policy 不是 Agent。Policy 是行为倾向,Agent 是真正放到环境里执行任务的完整系统。

Tool Use:让 Agent 接触外部世界

Tool Use 是工具调用。

模型自己只能生成文本。工具调用让它能接触外部世界:读写文件、运行代码、搜索网页、访问数据库、调用 API、操作浏览器。

一般流程是:模型用结构化方式表达“我要调用哪个工具、传什么参数”;Harness 接住这个请求,执行对应工具;工具返回结果以后,再把结果放回上下文,让模型继续下一轮判断。

工具调用让 Agent 从“会回答”变成“能做事”,但工具本身不等于 Agent。一个工具通常只负责一个动作,比如读文件、截图、搜索、运行命令。真正的任务推进,还要依赖 Harness 的调度和模型的判断。

Skills:把经验打包成可复用流程

Skills 是技能包。

它和工具不一样。工具通常是一个动作,Skill 更像一套完成任务的方法。

比如“运行一条命令”是工具;“排查一个报错”更适合做成 Skill。因为它通常包含读取日志、定位复现路径、提出假设、修改代码、运行测试、总结原因等多个步骤。

再比如“写公众号文章”也更像 Skill,而不是一个工具。它包含选题判断、阅读原文、确定受众、处理术语、写稿、配图、排版、推草稿箱、复盘反馈。

Tool 解决动作,Skill 沉淀流程。前者让 Agent 能做某件事,后者让 Agent 知道一类事情应该怎么做。

Sub-agents:能独立处理子任务的 Agent

Sub-agents 是子 Agent。

它不是普通工具,也不只是 Skill。子 Agent 自己也可以有模型、脚手架、工具和推理过程。主 Agent 把一个子任务交给它,它独立处理后返回结果。

比如主 Agent 负责写文章,可以让一个子 Agent 检查术语是否过难,让另一个子 Agent 生成配图方案,再由主 Agent 做最终判断。这里的子 Agent 不是一个函数调用,而是在处理一段相对完整的任务。

这也是多 Agent 系统真正有价值的地方。

但它也有前提:每个子 Agent 都要有清楚的目标、边界和返回格式。否则,多 Agent 不是协作,而是把混乱拆成更多份。

训练侧:普通用户知道大意就够

前面这些词,不管你是使用 Agent、部署 Agent,还是理解 Agent 产品,都会碰到。接下来几个词更偏训练侧。

普通用户不用掌握算法细节,但可以知道它们大概在说什么。

RL Environment 是强化学习环境。它是 Agent 互动的对象:Agent 做一个动作,环境更新状态,并返回新的观察结果。文件系统、网页、数据库、游戏环境,都可以成为某种意义上的环境。

Trainer 是训练器。它负责让 Agent 跑很多轮任务,收集结果,计算分数,并用这些结果更新模型。

Rollout 是一次完整尝试。可以理解成一条完整轨迹:Agent 看到了什么,做了什么,中间收到什么反馈,最后得到什么结果。

Reward 是奖励分数。它告诉训练系统这次表现好不好。测试通过可以是奖励,答案正确可以是奖励,人类偏好或另一个模型的评分也可以成为奖励。

这组词提醒我们:训练 Agent 不是只看最后一句回答,而是看一整轮任务里,它如何观察、行动、得到反馈,并在这些反馈中变得更好。

最后把关系收一下

如果把这些词放在一起,可以得到一个更清楚的层级:

Model 是最里面的模型能力。

Scaffolding 定义模型如何工作。

Harness 负责让流程真正运行。

Agent 是模型加外部结构以后形成的行动系统。

Context Engineering 决定模型每一步看到什么。

Policy 描述 Agent 的行为倾向。

Tool Use 让 Agent 能接触外部世界。

Skills 把多步骤经验打包成可复用流程。

Sub-agents 则把一部分任务交给另一个能独立推理和行动的 Agent。

理解这些词,不是为了显得更专业,而是为了在使用 AI 工具时判断得更准确。

当一个产品说自己是 Agent,我们可以继续看:它只是接了一个模型,还是有稳定的执行系统?它能调用工具,还是能管理一整轮任务?它有没有清楚的上下文机制?它的 Skill 能不能复用?子 Agent 有没有明确分工?

这些问题理清楚以后,AI Agent 就不再是一个模糊的大词,而是一套可以拆开理解、比较和改进的系统。

传统产品经理,正在成为下个被淘汰的“传统岗位”。

过去画原型、写 PRD、跟进度的“传统技能包”,在AI时代正迅速贬值。63% 的企业转型做 AI 产品!当下的问题不再是“要不要学 AI ”,而是“如何构建 AI 产品”。

前段时间还跟字节、腾讯的资深 AI 产品经理沟通,他们反馈:在大量招人,只要有 AI 相关的项目经验,基本都能拿到面试机会,而且领导很舍得给钱,涨薪 40-60% 很正常!

01

接下来的产品人,得卷AI能力了!

如今AI大火,行业极速发展的背后,懂AI 产品人才却严重稀缺。这不是要你转技术岗,而是要掌握构建 AI 产品的核心方法:

  • 如何将你的领域知识,转化为 AI 产品的核心竞争力?
  • 如何用 AI 技术实现你的产品需求?
  • 如何设计真正懂用户的 AI 交互体验?
  • ……

懂AI,就是产品经理的“救命稻草”!

风口之下,与其焦虑被行业淘汰

不如先人一步享受AI技术带来的红利!

我把AI产品经理的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

(不限年龄!不限岗位!没有代码基础也能学!)

🎁现在扫码,完课还送:

《AI产品面试题库》《AI大模型应用案例集》

02

掌握技术+实战,快速转型!

想成为一名卓越的AI大模型产品经理,需要从技术、到项目实战的全方位转型指南!

**1)**AI产品应用原理解析,产品经理也能听懂!

对于产品经理来说,如果你不懂技术,做不了业务和AI大模型技术衔接、定义不了数据需求,是没法完整的落地一个产品的!

本次课程,专门面向产品经理人群,解析当下最热门的AI产品应用的必备的「大模型」、「多模态」的实际应用和算法原理!解析AI产品应用技术,积累大模型能力!简单易懂,不需要会代码,小白也能掌握!

  • 大模型微调:掌握主流大模型(如DeepSeek、Qwen等)的微调技术,针对特定场景优化模型性能。学习如何利用领域数据(如制造、医药、金融等)进行模型定制
  • AI Agent智能体搭建:学习如何设计和开发AI Agent,实现多任务协同、自主决策和复杂问题解决。构建垂类场景下的智能助手产品(如制造业中的设备故障诊断Agent、金融领域的投资分析Agent等)

2)超全行业案例解析!

课程详细讲解现阶段,大模型在各个行业和领域的应用现状!包括:零售与电商、教育、医疗、泛娱乐、法律等等10大行业!

详细讲解案例的思路、应用场景,以及背后的技术原理、核心技术!揭秘各个行业、场景的真实现状,和未来产品的发展与机遇!

可以说,讲解完一个案例,就能积累一个AI产品实践的经验!

课程中所涉及到的实战项目,都可以直接在自己的工作中使用,让自己的产品/项目有可借鉴的成功案例!

3)AI产品经理求职专项辅导

课程中会系统的帮助大家拆解字节、腾讯、百度等大厂AI PM岗位JD关键词,掌握AI PM高频面试题型与回答框架;展示 AI 相关能力的关键技巧:Prompt设计、模型评估、A/B测试、成本意识、与算法/工程协作经验;

  • To B类AI产品经理:突出“行业理解 + 技术落地 + 商业闭环”能力的简历结构设计,展示项目成果;从客户需求洞察到技术方案设计,展现端到产品思维;如何评估To B AI产品的可行性、客户付费意愿与实施成本
  • To C类AI产品经理:拆解头部公司岗位JD,将过往尽力转化为AI产品叙事逻辑;从行业趋势、产品设计题、案例分析&数据分析题、技术理解边界等全流程辅导面试;避免无效海投、锁定最适合的AI产品岗位;

03

本次课程,全程直播讲解,能直接对话大佬和专业助教,不懂就问,超详细的案例,小白也能轻松get!

完课后,还赠送《AI产品经理面试题库》、《AI大模型应用案例集》!不断更新中……

适合人群:

  • 想转型AI产品经理、AI项目管理专家、AI产品解决方案等岗位
  • 想进行AI产品创业的创业者
  • 想成为制作AI产品的程序员
  • 想利用AI解决企业问题的管理岗
  • 想在AI方向寻找就业方向的毕业生
  • AI方向前景广阔、待遇好!

目前,很多产品人已经通过完整学习拿到大厂高薪offer,收入嗷嗷涨!

我把AI产品经理的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

http://www.gsyq.cn/news/1448655.html

相关文章:

  • Arduino倒计时器实战:从硬件连接到状态机编程
  • 实战指南:如何将闲置电视盒子改造成高性能Armbian服务器
  • STM32H743的FDCAN到底有多快?实测TJA1042T收发器实现5Mbps数据段传输(附CubeMX配置避坑点)
  • OpenHarmony开发避坑:musl与glibc混用导致编译失败的5个常见场景及解决
  • 从玩具舵机到机械臂:手把手教你用STM32F103+CubeMX配置PWM,驱动SG90和MG995搭建第一个机器人关节
  • 保姆级避坑指南:用Anaconda3和PyTorch 1.12.0在Windows上搞定NeRF-PyTorch环境(附清华源)
  • gibMacOS:跨平台下载macOS系统镜像的专业解决方案
  • AI动态简报之商业洞察篇(2026.06.02)
  • AI与大数据融合实践:从架构设计到场景落地的全链路指南
  • 新手必看:用Keil和Proteus 8.9给AT89C51单片机做个简易秒表(附完整代码和仿真文件)
  • 传统喝水越多越好,编写程序,结合气温运动量,肾功能数据,计算个人每日精准饮水量,预警饮水过量。
  • Web工程化命题,拒绝页面仔
  • 2026 深圳钻石回收实测榜单|五大正规机构真实测评! - 合扬奢侈品交易中心
  • 大模型的典型应用场景
  • WuWa-Mod:鸣潮游戏模组终极指南,5分钟解锁15+隐藏功能
  • Ansaldo 167A.0100009电源驱动板
  • 2026年榆次同城搬家公司权威口碑排行榜 - 资讯快报
  • 2节锂电池保护芯片PW7120集成过充过放过流短路保护
  • 向量空间JBoltAI:智能包装审核系统功能拆解
  • 基于Micro:bit的嵌入式游戏开发:从零构建太空鸟游戏
  • 防爆空调怎么选?资质、性能、售后三维评估+五大厂家汇总 - 深度智识库
  • 游戏闪退?可能是Vulkan的锅!Windows双显卡(独显+核显)环境下排查与切换Vulkan渲染器的完整指南
  • 别再瞎调电压了!用Density Evolution算法给NAND闪存和LDPC码做“联合体检”
  • 立方星实时数据压缩:专用计算架构如何突破星上处理瓶颈
  • Windows画图工具:裁剪与高亮功能的底层原理与高效应用
  • NumPy 1.25.0升级后,代码里np.complex报错?别急着降级,试试这个更稳的修复方法
  • 2026太原卫生间免砸砖防水、外墙、地下室、楼顶渗漏+彩钢瓦、阳光房漏水 本地专业防水公司TOP5权威推荐(2026年6月本地最新深度调研) - 企业资讯
  • 成都装修必看!2026全屋定制口碑榜单,过来人总结不踩坑优选清单 - 资讯快报
  • 2026 吉安 GEO 优化公司 TOP5 排名(AI 占位 + 本地转化双强) - GrowthUME
  • 这个岗位年薪80万,却招不到人,AI时代的机会比你想象的多