当前位置：首页 > news >正文

智能盒子-Agent-Skill-执行逻辑架构

news 2026/6/26 13:42:04

智能盒子-Agent-Skill-执行逻辑架构

在智能盒子的架构中，Agent Skill（智能插件/工具）的执行逻辑是一个从“非结构化语音输入”到“结构化指令执行”，再到“感知反馈”的完整闭环。

它基于MCP (Model Context Protocol)协议，通过Function Calling机制实现。以下是详细的执行逻辑拆解：

1. 整体执行流程图

Agent Skill 的执行不是孤立的，它与意图识别、长短期记忆以及情感引擎深度耦合。

2. 核心执行阶段

第一阶段：意图识别与工具匹配 (Intent Routing)

语音转文字 (ASR)：用户输入（如：“帮我看看明天武汉要不要带伞”）。
意图路由 (Router)：中台根据用户话术解析意图。如果识别为“查询类”或“控制类”，则进入 Skill 匹配流程。
可用工具检索 (Discovery)：系统从Available Tools库中根据当前上下文检索匹配的 Skill 定义（如：get_weather）。

第二阶段：参数抽取与指令生成 (Parameter Extraction)

大模型推理：将用户输入与选定的工具 Meta 信息（JSON Schema）投喂给 LLM。
结构化输出：LLM 不直接回答问题，而是输出符合标准的JSON 指令。
- 示例：{"tool": "weather_service", "params": {"city": "Wuhan", "date": "tomorrow"}}
MCP 插件下沉：通过 MCP 协议将该 JSON 指令分发至具体的业务逻辑层或边缘端（ESP32）。

第三阶段：任务编排与执行 (Orchestration & Execution)

原子化拆解：对于复杂任务（如：“先帮我开灯，然后查一下最近的新闻”），编排引擎会将请求拆分为多个顺序或并行的 Skill 调用。
闭环执行：
- 外部调用：访问天气 API、搜索接口或 IoT 指令。
- 异常处理：若工具调用失败（如接口超时），系统需捕获 Error 并反馈给 LLM 进行自愈或提示用户。

第四阶段：感知更新与结果润色 (Feedback & Response)

记忆写入：执行结果（如：“武汉明天有雨”）会被存入短期记忆。
情绪/亲密度反馈：
- 成功执行：触发on_skill_success，根据 PRD 逻辑，增加 AI 的支配感（Dominance）和用户亲密度（Intimacy += 0.01）。
最终回复生成：LLM 结合执行结果与当前性格/情绪状态，生成拟人化的语音回复。

3. 基于 Go-zero 的技术实现细节

在你的项目中，这套逻辑在代码层面通常表现为以下链路：

定义层 (Schema)：在go-zero的插件服务中定义各 Skill 的输入输出规范。

调用层 (Invocation)：

Go

// 简化后的工具调度逻辑 func (s *SkillEngine) Execute(ctx context.Context, call ToolCall) (string, error) { // 1. 意图分发 handler, ok := s.registry[call.FunctionName] if !ok { return "", ErrToolNotFound } // 2. 权限/上下文检查 (结合 RAG 记忆) // 3. 业务逻辑执行 result, err := handler.Do(ctx, call.Arguments) // 4. 反馈给情绪引擎更新 PAD 状态 s.moodService.UpdateByAction(call.FunctionName, err == nil) return result, nil }

4. 关键特性：MCP 协议的意义

通过引入MCP (Model Context Protocol)，你的 Agent Skill 具备了以下优势：

标准化：无论 Skill 是运行在云端（天气预报）还是边缘端 ESP32（红外控制），其接口协议是统一的。
动态性：LLM 可以根据当前对话的上下文，动态决定是否需要“增加”某个临时工具，实现真正的任务编排。
安全隔离：大模型只负责“决策”调用哪个工具，而“执行”权在受控的插件系统中，避免了注入风险。

总结：Agent Skill 的执行逻辑是“识别 -> 拆解 -> 执行 -> 反馈”。在智能盒子中，它不仅完成了功能交付，更通过执行结果的反馈，驱动了 AI 长期记忆的更新和情感状态的起伏。

http://www.gsyq.cn/news/1344738.html

相关文章：

鸣潮自动化终极指南：3步开启智能游戏体验

Carnac键盘记录工具：让你的按键操作在屏幕上可视化显示 [特殊字符]

N_m3u8DL-CLI-SimpleG：图形化M3U8视频下载工具完整指南

空洞骑士模组管理器Scarab完整指南：从安装到精通的高效解决方案

致 QiLink 社区的一封信

Kill-Doc：彻底解决在线文档下载难题的浏览器脚本解决方案

如何用kill-doc脚本一键下载30+文档平台的免费资源：技术开发者必备工具

Noto Emoji跨平台字体架构：3种技术实现方案与性能优化指南

开封汴绣送礼推荐与寓意解析

BetterNCM Installer：网易云音乐PC版的终极插件管理解决方案

BarrageGrab深度解析：构建多平台实时数据采集工具的技术实现

基于微信小程序实现民大食堂用餐综合服务平台管理系统【内附项目源码+论文说明】

Sunshine：打造个人专属游戏云，跨设备畅玩3A大作的终极方案

终极AMD Ryzen硬件调试指南：SMUDebugTool完全免费开源工具

2026TOP5株洲市渌口区黄金，白银，铂金回收门店推荐及联系方式权威发布 - 前途无量YY

终极AMD Ryzen性能调优指南：5分钟掌握SMUDebugTool免费调试神器

Falco 容器安全监控实践：实时威胁检测

Navicat下载安装详细教程（2026最新版本）

AI写论文神器来袭！4款AI论文写作工具，让写论文变得超简单！

2026安远县黄金回收白银回收铂金回收店铺实力排行榜TOP5;K金＋金条＋银条＋首饰回收靠谱门店及联系方式推荐 - 前途无量YY

2026TOP5株洲市天元区黄金，白银，铂金回收门店推荐及联系方式权威发布 - 前途无量YY

CVE-2026-9082深度解析：Drupal PostgreSQL高危SQL注入，未认证RCE全流程与防御实战

Cursor释放野心，要造一个Agent开发环境！

Linux Make/Makefile基础知识

ContentBranch+CFBranch混合电影推荐模型｜全网独家复现，深度学习实战篇引入双分支融合架构，兼顾内容特征与协同信号、助力冷启动缓解、数据稀疏性优化、推荐精度有效涨点

Sunshine游戏串流服务器：如何5分钟内搭建私人云游戏平台？

2026年3大知识竞赛软件测评：告别抢答器，手机闯关如何玩出高级感？

QQ音乐加密文件终极转换指南：3步将.qmc文件转为MP3/FLAC

DS4Windows终极指南：如何在Windows上完美使用PS4/PS5手柄玩所有游戏

CANN-opbase-昇腾NPU算子开发的基础设施为什么这么重要