当前位置: 首页 > news >正文

[智能体-584]:Hermes 自带工具集完整详解

一、基础概念:工具 / 工具集 区别

  1. 工具(Tool)最小执行单元,是可被模型自动调用的底层函数(如read_fileterminalcronjob)。
  2. 工具集(Toolset):按业务场景打包一组关联工具,支持一键启用 / 禁用,隔离权限。
  3. 两类入口:
    • 模型自动调用:LLM 判断需求自动触发工具;
    • 会话斜杠命令/tools:手动查看、开关全部内置工具集。
  4. 分层:原生内置工具集(开箱即用,无需额外 MCP 服务)+MCP 外部扩展工具(外接数据库 / Git 等)。

二、Hermes-CLI 默认完整内置工具集(交互终端默认全启用)

1. file 文件工具集(开发 / 文档核心)

包含工具:read_filewrite_filepatchsearch_fileslist_dirmvrmmkdir

  • 功能:本地文件完整读写、代码局部补丁修改、全局文件检索、目录管理;
  • 场景:读取配置、生成代码文件、批量修改项目、日志检索;
  • 安全:支持目录白名单限制,防止越权读写系统文件。

2. 命令行terminal 终端工具集(运维 / 脚本执行)

包含工具:terminalprocess

  • terminal:执行Bash/PowerShell 命令,支持前台、后台、指定工作目录;兼容本地 / SSH/Docker 远端终端;
  • process:后台进程管理:查看、等待、杀死异步任务;
  • 场景:编译项目、服务启停、批量运维脚本、Git 操作。

3. web 网络搜索工具集

工具:web_searchweb_extract

  • web_search:全网检索(支持 Tavily/Firecrawl 后端);
  • web_extract:抓取网页正文、自动转 Markdown,去除广告;
  • 场景:资料调研、行业文档抓取、实时资讯查询。

4. browser 无头浏览器自动化工具集(12 个内置工具)

工具:browser_navigatebrowser_clickbrowser_inputbrowser_scrollbrowser_visionbrowser_screenshotbrowser_waitbrowser_download

  • 能力:完整 CDP 无头浏览器,模拟人工点击、输入、截图、OCR、页面视觉分析;
  • 场景:自动化填报、网页数据爬取、表单批量提交、网页截图归档。

5. vision + image_gen多媒体视觉工具集

  1. vision:图片 OCR 识别、图像内容理解、截图解析;
  2. image_gen:文生图、图生图生成; 配套/image斜杠命令上传本地图片分析。

6. cronjob 定时调度工具集(你重点关注)

内置全套定时任务底层工具,对应会话内/cron系列斜杠命令:

  • cron_create:创建定时任务,接收标准 Cron 表达式;
  • cron_list:查询全部任务、下次执行时间;
  • cron_pause/resume/remove/run:暂停、恢复、删除、手动执行任务;
  • cron_status:调度服务健康检查;
  • 持久化:任务存入本地数据库,Hermes 后台常驻即可自动触发。

7. memory 跨会话记忆工具集

工具:memory_storememory_recall

  • 持久存储关键信息,跨会话不丢失;
  • 区分临时对话上下文与长期记忆;
  • 搭配session_search:检索历史全部对话记录。

8. code_execution 代码运行工具集

工具:execute_code

  • 沙箱执行 Python/JS 代码;
  • 支持数据计算、CSV/JSON 处理、简单绘图;
  • 隔离沙箱,禁止高危系统操作。

9. delegation 子智能体编排工具集

核心工具delegate_task

  • 自动拆分复杂任务,生成独立子 Agent 处理细分工作;
  • 子 Agent 拥有隔离上下文、独立工具权限;
  • 支持多层递归委派、多任务并行执行、结果聚合;
  • 场景:多源数据并行调研、复杂方案分步拆解。

10. messaging 消息推送工具集

内置多平台消息发送:飞书、钉钉、Discord、Slack、Telegram;

工具send_message:定时任务完成、告警、报表自动推送。

11. tts 语音工具集

text_to_speech文本转语音朗读,支持 Edge TTS、ElevenLabs;对应/voice斜杠指令。

12. todo 任务规划工具集

会话内轻量化任务看板,创建、标记、查询待办事项,用于复杂任务分步跟踪。

13. clarify 交互澄清工具

模型自动调用,当需求模糊时主动向用户提问补全信息,减少幻觉。

14. skills 技能管理工具集

工具:skills_listskill_viewskill_createskill_patchreload_skills

  • 管理自定义封装工作流技能;
  • 对应会话斜杠/skills/reload

15. safe 只读安全工具集

仅开放文件读取、网页查询,禁用写入 / 终端执行,用于安全只读会话。

三、扩展配套平台工具集(非默认,按需启用)

  1. rl 训练工具集:大模型微调、LoRA 训练、指标监控(需 TINKER/WandB 密钥);
  2. homeassistant 智能家居工具集:HA 设备控制、状态查询;
  3. kanban 看板工具集:内置项目任务看板管理;
  4. spotify/yuanbao/feishu:第三方平台专属工具集;
  5. computer_use:桌面自动化(macOS 后台键鼠控制)。

四、MCP 外部工具(不属于 Hermes 原生内置,补充区分)

Hermes 支持 MCP 协议接入第三方服务,不属于自带工具集,需手动配置:

  • 文件 MCP、数据库 MCP、GitHub/GitLab、日历、企业内部 API;
  • 启动命令hermes mcp serve可把 Hermes 自身暴露为 MCP 服务给 Cursor、VSCode 调用。

五、工具集管理操作(Hermes 会话内斜杠命令)

  1. /tools:查看当前已启用全部内置工具集、开关状态;
  2. /reload:重载所有工具集、技能、MCP 配置;
  3. /debug:开启工具调用完整日志,查看模型调用了哪些内置工具;
  4. /status:查看当前会话允许的工具集白名单。

六、内置工具集 vs 斜杠命令 / 自然语言 三层关系

  1. 底层:内置工具函数(模型自动调用,无用户感知);
  2. 中层:/ 斜杠命令(用户手动快捷入口,直接映射工具集能力,不走 LLM 推理);
    • /cron→ 调用 cronjob 工具集;
    • /model→ 切换模型配置工具;
    • /clear→ 清空 memory 临时上下文;
  3. 上层:自然语言(模型理解需求,自动选择对应内置工具执行)。

七、内置工具集核心特点

  1. 开箱即用:安装 Hermes 后无需额外部署,CLI 交互模式默认全加载;
  2. 权限隔离:工具集可单独禁用,关闭终端 / 文件写入可提升安全性;
  3. 调度联动cronjob定时工具可串联文件、终端、消息推送工具,实现自动化流水线;
  4. 可观测/debug日志完整记录每一次工具调用参数、返回结果;
  5. 无幻觉:内置工具为固定底层函数,执行结果确定性强,不会出现语义偏差。

八、典型业务流水线示例(多内置工具集联动)

  1. /cron create "0 0 8 * * ?" 每日生成业务报表
  2. 定时触发 →terminal执行数据导出脚本 →file写入 Excel 报表 →web_extract抓取行业数据补充 →send_message推送飞书报表。 整条链路全部由 Hermes 原生内置工具集完成,无需外部插件。
http://www.gsyq.cn/news/1599305.html

相关文章:

  • AI 工作流引擎设计:从提示词编排到多步骤任务自动化
  • 【docker】从弃用到替代:在容器中部署Eclipse Temurin JDK的实践指南
  • DUET框架:AI驱动的RTL设计理解与验证实践
  • 终极散热掌控:FanControl免费开源风扇控制软件完整解析
  • RL78定时器API实战:从TKB电机PWM到TAU/TRJ精准测量
  • 隧道火灾数据集 隧道事故检测 隧道内交通事故识别数据集 隧道火灾数据集 隧道逆行识别数据集 yolo格式隧道AI识别图像数据集第10162期
  • 从零到一掌握CAD:核心概念、关键功能与行业实践
  • ucore操作系统实验3种高效路径:新手快速上手指南
  • LaTeX实战:从零上手IEEE Trans期刊模板的下载与配置
  • 宝兰德BES应用服务器部署时`GC overhead limit exceeded`与`Java heap space`内存溢出问题诊断与调优实战
  • 三步革新:彻底解决Garry‘s Mod跨平台兼容性问题
  • 瑞萨RA MCU I2C驱动配置与调试实战指南
  • GB28181协议:从标准诞生到实战部署的演进之路
  • 如何一键激活Windows和Office?KMS_VL_ALL_AIO智能脚本完整指南
  • 将字符串翻转到单调递增
  • VSCode + PlantUML:从零构建专业级UML类图
  • 赛博朋克2077终极存档编辑器:免费修改夜之城的完整指南
  • 终极字体库指南:15款专业字体一键获取与安装教程 [特殊字符]
  • 【多目标跟踪技术演进】从TransTrack到MOTR:Transformer在MOT中的核心范式与实战解析
  • LX Music音源配置指南:5步解锁全网高品质音乐
  • 深入解析CANFD模块状态机:从全局模式到通道模式的实战指南
  • 基于SpringBoot+Vue的招聘系统管理系统设计与实现【Java+MySQL+MyBatis完整源码】
  • H3C交换机基于ACL实现VLAN间安全隔离实战
  • 200-300元学生党耳机推荐:哪些产品更适合长期使用?
  • Video2X终极指南:如何免费实现AI视频放大和帧率提升
  • openEuler虚拟机磁盘在线扩容实战:无需重启的LVM扩展指南
  • MIPI DSI命令模式序列操作:寄存器配置与工程调试全解析
  • 从SPWM到马鞍波:Simulink仿真揭示三次谐波注入提升电压利用率
  • 5个方法彻底解决ExplorerPatcher导致的Windows资源管理器崩溃问题:终极修复指南
  • Android Studio中文界面配置:告别英文困扰的5个关键步骤