当前位置：首页 > news >正文

AI Agent术语大揭秘：从底层模型到完整系统，一篇读懂！

news 2026/6/2 18:22:38

本文深入探讨了AI Agent领域的核心概念，包括Model（模型）、Scaffolding（脚手架）、Harness（执行系统）、Agent（智能体）、Context Engineering（上下文工程）、Policy（策略）、Tool Use（工具使用）、Skills（技能）和Sub-agents（子智能体），以及RL Environment（强化学习环境）、Trainer（训练器）、Rollout（试运行）和Reward（奖励机制）等训练侧概念。文章旨在帮助读者理解这些术语在AI Agent系统中的位置和作用，从而更准确地判断和比较不同AI Agent产品的能力，而不仅仅是关注底层模型。

一个领域发展太快的时候，术语往往会先跑起来，共识反而慢半拍。

AI Agent 现在就是这样。

Model、Scaffolding、Harness、Agent、Context Engineering、Policy、Tool Use、Skills、Sub-agents……这些词在文章、产品文档和社区讨论里频繁出现，但它们有时指向不同层级，有时又被混着使用。结果是：你明明知道大家都在聊 Agent，却很难判断他们到底在说模型、产品、工具调用，还是一整套执行系统。

这篇文章不做术语表，也不追求给每个词下一个绝对标准的定义。更实际的目标是：把几个最容易混淆的概念放回它们该在的位置。理解这些位置以后，再看 Claude Code、Codex、Cursor 这类工具，就不会只停留在“底层模型是什么”这一层。

整篇会按两部分展开。

第一部分是使用侧：Model、Scaffolding、Harness、Agent、Context Engineering、Policy、Tool Use、Skills、Sub-agents。它们决定一个 Agent 工具是怎么跑起来、怎么使用工具、怎么管理上下文、怎么把任务持续推进的。

第二部分是训练侧：RL Environment、Trainer、Rollout、Reward。普通用户不需要深入算法，但知道这些词的大意，有助于理解 Agent 为什么不只是“最后回答对不对”，而是要看一整轮任务里的行为过程。

Model：模型只是最里面的一层

Model 就是我们常说的大语言模型，比如 GPT、Claude、Qwen、Kimi、DeepSeek。

它的基本能力很明确：输入文字，输出文字。

这一点看起来简单，但很关键。模型本身没有自动循环，也不会真的执行外部动作。它可以在回答里表达“我需要读文件”“我想调用工具”，但真正去读文件、调用工具、把结果带回来继续下一步，并不是模型单独完成的。

所以，一个 Agent 产品不等于一个模型。

模型是核心能力，但不是完整系统。很多产品即使用相近的底层模型，体验也可能差很多，因为模型外面还包着提示词、工具、上下文管理、执行循环、权限边界等一整套东西。

Scaffolding：让模型知道如何工作的结构

Scaffolding 通常翻译成“脚手架”。

如果只看中文，这个词会有点抽象。更准确地说，它指的是模型周围那层定义行为的结构：系统提示词、工具说明、输出格式、解析规则、上下文管理方式，以及模型在多步任务中需要遵守的工作方式。

它不是模型本身，但会深刻影响模型的表现。

比如同一个模型，放在普通聊天窗口里，它可能只是回答问题；放在一个写作工作流里，它会先读材料、判断受众、控制语气、检查标题；放在一个代码 Agent 里，它会读文件、规划修改、运行测试、根据报错继续调整。

这些差异不完全来自模型能力，而来自脚手架对“模型应该怎么看世界、怎么行动”的设定。

所以，Scaffolding 可以理解为：让模型进入某种工作状态的结构。

Harness：真正让 Agent 跑起来的执行系统

Harness 是这组词里最容易混淆的一个。

直译成“线束”没有太大帮助。在 Agent 语境里，把它理解成“执行系统”更清楚。

如果说 Scaffolding 定义了模型如何工作，那么 Harness 负责让整个过程真的跑起来。它会调用模型，接住模型发出的工具调用，路由到正确的工具，把工具结果放回上下文，并决定任务要不要继续。

举个简单过程：

模型说要读一个文件，Harness 负责真的读取文件；模型根据文件内容提出修改，Harness 负责执行修改；修改后需要跑测试，Harness 再把测试结果交回模型，让模型判断下一步。

这也是很多 Agent 产品差异很大的地方。

有些执行系统很激进，拿到任务就一路做下去；有些执行系统更保守，会先读上下文、列计划、遇到风险停下来问人。有些产品工具很多，但调度混乱；有些工具不多，但停止条件和错误处理做得更稳。

所以讨论 Agent 时，不能只问模型强不强，还要看 Harness 设计得好不好。

Agent：重点是“循环”，不是“会聊天”

Agent 这个词最早来自强化学习。最基础的结构是：接收 observation（观察结果），输出 action（动作），环境根据这个动作返回新的 observation，然后继续循环。

这个“观察—动作—新观察”的循环，是理解 Agent 的关键。

在大语言模型产品里，Agent 的含义扩大了：它不只是一个模型，而是模型加上外部结构以后，形成的一套能行动的系统。它可以接收信息，决定下一步，调用工具，看到结果，再继续行动。

普通聊天窗口通常是你问一句，它答一句。Agent 则更像一个能持续处理任务的系统。

比如代码 Agent 会先读文件，再修改代码，再运行测试，再根据报错继续修。每一步都有新的观察结果，每一步都会影响下一步动作。这个循环跑起来，才是 Agent 和普通问答最核心的区别。

Context Engineering：决定模型每一步看见什么

Context Engineering 是上下文工程。

它关心的问题是：模型在每一次调用时，应该看到哪些信息。

系统提示词、工具说明、历史对话、文件内容、搜索结果、工具返回值、长期记忆，都可能进入上下文。放少了，模型不知道前因后果；放多了，模型会被噪音干扰；放错了，模型可能沿着错误方向继续推理。

这也是为什么现在很多 Agent 工具越来越重视规则文件、项目记忆、Skill、任务卡和检索策略。它们本质上都在解决同一个问题：让模型在合适的时刻看到合适的信息。

上下文工程不是一次性配置。Agent 每推进一步，前面的工具结果、错误信息、用户补充、文件变化，都会影响下一轮模型调用。Harness 需要持续管理这些内容。

短期记忆和长期记忆也属于这个范围。短期记忆是本轮任务里的对话和工具结果；长期记忆则存在外部，需要时再取回来放进上下文。

Policy：Agent 的行为策略

Policy 可以翻译成行为策略。

它描述的是 Agent 在不同情况下倾向于怎么行动。

遇到报错，是先查日志还是直接改代码？遇到不确定，是停下来问人还是自己猜？遇到危险操作，是继续执行还是请求确认？这些都属于行为策略。

在 LLM 系统里，Policy 一部分来自模型本身，一部分来自外部结构。提示词、工具、权限、记忆、停止条件、错误处理规则，都会影响 Agent 的行为。

这也是为什么同一个模型，换一个产品或一套规则，做事风格会变得很不一样。

需要注意的是，Policy 不是 Agent。Policy 是行为倾向，Agent 是真正放到环境里执行任务的完整系统。

Tool Use：让 Agent 接触外部世界

Tool Use 是工具调用。

模型自己只能生成文本。工具调用让它能接触外部世界：读写文件、运行代码、搜索网页、访问数据库、调用 API、操作浏览器。

一般流程是：模型用结构化方式表达“我要调用哪个工具、传什么参数”；Harness 接住这个请求，执行对应工具；工具返回结果以后，再把结果放回上下文，让模型继续下一轮判断。

工具调用让 Agent 从“会回答”变成“能做事”，但工具本身不等于 Agent。一个工具通常只负责一个动作，比如读文件、截图、搜索、运行命令。真正的任务推进，还要依赖 Harness 的调度和模型的判断。

Skills：把经验打包成可复用流程

Skills 是技能包。

它和工具不一样。工具通常是一个动作，Skill 更像一套完成任务的方法。

比如“运行一条命令”是工具；“排查一个报错”更适合做成 Skill。因为它通常包含读取日志、定位复现路径、提出假设、修改代码、运行测试、总结原因等多个步骤。

再比如“写公众号文章”也更像 Skill，而不是一个工具。它包含选题判断、阅读原文、确定受众、处理术语、写稿、配图、排版、推草稿箱、复盘反馈。

Tool 解决动作，Skill 沉淀流程。前者让 Agent 能做某件事，后者让 Agent 知道一类事情应该怎么做。

Sub-agents：能独立处理子任务的 Agent

Sub-agents 是子 Agent。

它不是普通工具，也不只是 Skill。子 Agent 自己也可以有模型、脚手架、工具和推理过程。主 Agent 把一个子任务交给它，它独立处理后返回结果。

比如主 Agent 负责写文章，可以让一个子 Agent 检查术语是否过难，让另一个子 Agent 生成配图方案，再由主 Agent 做最终判断。这里的子 Agent 不是一个函数调用，而是在处理一段相对完整的任务。

这也是多 Agent 系统真正有价值的地方。

但它也有前提：每个子 Agent 都要有清楚的目标、边界和返回格式。否则，多 Agent 不是协作，而是把混乱拆成更多份。

训练侧：普通用户知道大意就够

前面这些词，不管你是使用 Agent、部署 Agent，还是理解 Agent 产品，都会碰到。接下来几个词更偏训练侧。

普通用户不用掌握算法细节，但可以知道它们大概在说什么。

RL Environment 是强化学习环境。它是 Agent 互动的对象：Agent 做一个动作，环境更新状态，并返回新的观察结果。文件系统、网页、数据库、游戏环境，都可以成为某种意义上的环境。

Trainer 是训练器。它负责让 Agent 跑很多轮任务，收集结果，计算分数，并用这些结果更新模型。

Rollout 是一次完整尝试。可以理解成一条完整轨迹：Agent 看到了什么，做了什么，中间收到什么反馈，最后得到什么结果。

Reward 是奖励分数。它告诉训练系统这次表现好不好。测试通过可以是奖励，答案正确可以是奖励，人类偏好或另一个模型的评分也可以成为奖励。

这组词提醒我们：训练 Agent 不是只看最后一句回答，而是看一整轮任务里，它如何观察、行动、得到反馈，并在这些反馈中变得更好。

最后把关系收一下

如果把这些词放在一起，可以得到一个更清楚的层级：

Model 是最里面的模型能力。

Scaffolding 定义模型如何工作。

Harness 负责让流程真正运行。

Agent 是模型加外部结构以后形成的行动系统。

Context Engineering 决定模型每一步看到什么。

Policy 描述 Agent 的行为倾向。

Tool Use 让 Agent 能接触外部世界。

Skills 把多步骤经验打包成可复用流程。

Sub-agents 则把一部分任务交给另一个能独立推理和行动的 Agent。

理解这些词，不是为了显得更专业，而是为了在使用 AI 工具时判断得更准确。

当一个产品说自己是 Agent，我们可以继续看：它只是接了一个模型，还是有稳定的执行系统？它能调用工具，还是能管理一整轮任务？它有没有清楚的上下文机制？它的 Skill 能不能复用？子 Agent 有没有明确分工？

这些问题理清楚以后，AI Agent 就不再是一个模糊的大词，而是一套可以拆开理解、比较和改进的系统。

传统产品经理，正在成为下个被淘汰的“传统岗位”。

过去画原型、写 PRD、跟进度的“传统技能包”，在AI时代正迅速贬值。63% 的企业转型做 AI 产品！当下的问题不再是“要不要学 AI ”，而是“如何构建 AI 产品”。

前段时间还跟字节、腾讯的资深 AI 产品经理沟通，他们反馈：在大量招人，只要有 AI 相关的项目经验，基本都能拿到面试机会，而且领导很舍得给钱，涨薪 40-60% 很正常！

接下来的产品人，得卷AI能力了！

如今AI大火，行业极速发展的背后，懂AI 产品人才却严重稀缺。这不是要你转技术岗，而是要掌握构建 AI 产品的核心方法：

如何将你的领域知识，转化为 AI 产品的核心竞争力？
如何用 AI 技术实现你的产品需求？
如何设计真正懂用户的 AI 交互体验？
……

懂AI，就是产品经理的“救命稻草”！

风口之下，与其焦虑被行业淘汰

不如先人一步享受AI技术带来的红利！

我把AI产品经理的学习全流程已经整理📚好了！抓住AI时代风口，轻松解锁职业新可能，希望大家都能把握机遇，实现薪资/职业跃迁～

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

（不限年龄！不限岗位！没有代码基础也能学！）

🎁现在扫码，完课还送：

《AI产品面试题库》《AI大模型应用案例集》

掌握技术+实战，快速转型！

想成为一名卓越的AI大模型产品经理，需要从技术、到项目实战的全方位转型指南！

**1）**AI产品应用原理解析，产品经理也能听懂！

对于产品经理来说，如果你不懂技术，做不了业务和AI大模型技术衔接、定义不了数据需求，是没法完整的落地一个产品的！

本次课程，专门面向产品经理人群，解析当下最热门的AI产品应用的必备的「大模型」、「多模态」的实际应用和算法原理！解析AI产品应用技术，积累大模型能力！简单易懂，不需要会代码，小白也能掌握！

大模型微调：掌握主流大模型（如DeepSeek、Qwen等）的微调技术，针对特定场景优化模型性能。学习如何利用领域数据（如制造、医药、金融等）进行模型定制
AI Agent智能体搭建：学习如何设计和开发AI Agent，实现多任务协同、自主决策和复杂问题解决。构建垂类场景下的智能助手产品（如制造业中的设备故障诊断Agent、金融领域的投资分析Agent等）

2）超全行业案例解析！

课程详细讲解现阶段，大模型在各个行业和领域的应用现状！包括：零售与电商、教育、医疗、泛娱乐、法律等等10大行业！

详细讲解案例的思路、应用场景，以及背后的技术原理、核心技术！揭秘各个行业、场景的真实现状，和未来产品的发展与机遇！

可以说，讲解完一个案例，就能积累一个AI产品实践的经验！

课程中所涉及到的实战项目，都可以直接在自己的工作中使用，让自己的产品/项目有可借鉴的成功案例！

3）AI产品经理求职专项辅导

课程中会系统的帮助大家拆解字节、腾讯、百度等大厂AI PM岗位JD关键词，掌握AI PM高频面试题型与回答框架；展示 AI 相关能力的关键技巧：Prompt设计、模型评估、A/B测试、成本意识、与算法/工程协作经验；

To B类AI产品经理：突出“行业理解 + 技术落地 + 商业闭环”能力的简历结构设计，展示项目成果；从客户需求洞察到技术方案设计，展现端到产品思维；如何评估To B AI产品的可行性、客户付费意愿与实施成本
To C类AI产品经理：拆解头部公司岗位JD，将过往尽力转化为AI产品叙事逻辑；从行业趋势、产品设计题、案例分析&数据分析题、技术理解边界等全流程辅导面试；避免无效海投、锁定最适合的AI产品岗位；

本次课程，全程直播讲解，能直接对话大佬和专业助教，不懂就问，超详细的案例，小白也能轻松get！

完课后，还赠送《AI产品经理面试题库》、《AI大模型应用案例集》！不断更新中……

适合人群：