当前位置：首页 > news >正文

AI Agent 的三次进化

news 2026/6/3 22:36:17

我们构建 AI 的方式在三年内改变了三次。大多数人还在追赶第二次转变。第三次转变已经到来了。

当 ChatGPT 问世时，每个人都成了提示工程师。

游戏很简单：问更好的问题，得到更好的答案。给模型一个角色。把你的任务分解成步骤。添加示例。链式思考。你的提示越好，输出就越好。

这对一次性任务很有效。提问，接收，完成。

但当我们开始用 AI 构建产品时，情况发生了变化。不再是一次性查询，而是需要在步骤间推理、记住事情、在真实系统中采取真实行动的系统。单靠提示已经不够了。

到 2025 年中，Andrej Karpathy 明确指出：上下文工程比提示工程更重要。

洞察很简单但重要：模型只能对它能看到的东西进行推理。真正的问题不只是你问了什么，而是模型在推理时看到了什么。

上下文工程是塑造模型输入窗口的一切：系统提示、对话历史、检索的文档、工具定义、记忆注入等。

如果提示工程是"右转"的命令，上下文工程给模型地图、路标和地形，让它真正理解在这种情况下右转意味着什么。

在 Salesforce，Agentforce 的很多基础设计就存在于这一层——在推理时用正确的 CRM 数据、客户上下文和业务规则来让 Agent 落地。正确的上下文是一个听起来有帮助的 Agent 和一个在你的特定业务场景中确实有帮助的 Agent 之间的分水岭。

但是一旦 Agent 开始在生产中自主运行，在真实企业系统的多个步骤中采取真实行动，一整套新问题就出现了。更好的上下文无法解决的问题。

问题是这样的：即使有完美的提示和完美的上下文，一个自主 Agent 仍然会脱轨。

它可能违反你公司的数据访问策略。升级一个它应该解决的案例。触发 Salesforce 中一个无法回滚的操作。或者自信地完全完成了错误的任务。

这些不是上下文问题。它们是环境问题。

Harness 工程是设计 Agent 环境的学科：约束、反馈循环、脚手架和运营系统，使 Agent 保持正轨。

在企业世界中，当 Agent 触及客户记录、财务数据和合规工作流时，harness 必须做到所有这些，还要确保信任、安全和可审计性。风险更高，harness 必须更加精心设计。

这是最简洁的心智模型：

如果你不是模型，你就是 harness。

围绕模型的一切——代码、配置、工具、记忆、执行逻辑、约束和反馈循环——都是 harness。原始模型不是 Agent。一个带有精心设计 harness 的模型才是一个工作引擎。

三个层次清晰地嵌套：

提示工程问：我应该问什么？它优化指令。
上下文工程问：模型应该看到什么？它优化输入窗口。
Harness 工程问：整个环境应该如何设计？它优化模型周围的系统。
每一层解决不同类别的问题。随着 Agent 承担更多自主的、长期的工作，harness 层的重要性超过了其他两层之和。