每日 Agent 核心知识Day1:基础定义与核心特征(入门认知)
一、Agent 标准定义
AI 智能体(Agent):以大模型(LLM)为"大脑",具备感知 → 思考 → 行动 → 记忆 闭环,能自主拆解多步骤任务、调用外部工具,主动达成用户目标的智能系统。
通用公式:
Agent = LLM(大脑) + 记忆系统 + 规划模块(Planning)+ 工具集(Tools/API)
二、四大核心特征(vs 普通聊天机器人)
特征 | 说明 |
|---|---|
🔄自主性 | 无需用户逐步骤指令,可自行规划并完成全流程 |
⚡反应性 | 感知环境/工具返回结果,动态修正执行方案 |
🎯主动性 | 为完成目标主动发起搜索、调 API、读/写文件等 |
🏁目标导向 | 所有行为围绕最终任务目标,完成后自动终止 |
三、普通 LLM vs Agent 对比
维度 | 普通对话 LLM | AI Agent |
|---|---|---|
交互方式 | 被动问答 | 自主多轮循环执行 |
任务拆解 | ❌ 不支持 | ✅ 自动规划子任务 |
外部调用 | ❌ 无法调用 | ✅ 搜索 / 代码执行 / API / 文件 |
输出结果 | 文字建议 | 可直接完成任务的执行结果 |
示例——「帮我做一个周末北京→杭州的旅游攻略」
普通 LLM:返回文字版攻略建议 📄
Agent:自动查机票价格、筛选酒店、查景点开放时间、生成可编辑行程并保存文档 ✈️🏨📋
四、典型 Agent 执行循环(ReAct / CoT+Tool)
感知(用户输入) → 规划(Planner 拆子任务) → 选择工具(Tool Call) → 执行 & 获取反馈 → 记忆更新(Memory) → 判断是否完成 → 继续 or 返回结果