[智能体-584]:Hermes 自带工具集完整详解
一、基础概念:工具 / 工具集 区别
- 工具(Tool):最小执行单元,是可被模型自动调用的底层函数(如
read_file、terminal、cronjob)。 - 工具集(Toolset):按业务场景打包一组关联工具,支持一键启用 / 禁用,隔离权限。
- 两类入口:
- 模型自动调用:LLM 判断需求自动触发工具;
- 会话斜杠命令
/tools:手动查看、开关全部内置工具集。
- 分层:原生内置工具集(开箱即用,无需额外 MCP 服务)+MCP 外部扩展工具(外接数据库 / Git 等)。
二、Hermes-CLI 默认完整内置工具集(交互终端默认全启用)
1. file 文件工具集(开发 / 文档核心)
包含工具:read_file、write_file、patch、search_files、list_dir、mv、rm、mkdir
- 功能:本地文件完整读写、代码局部补丁修改、全局文件检索、目录管理;
- 场景:读取配置、生成代码文件、批量修改项目、日志检索;
- 安全:支持目录白名单限制,防止越权读写系统文件。
2. 命令行terminal 终端工具集(运维 / 脚本执行)
包含工具:terminal、process
terminal:执行Bash/PowerShell 命令,支持前台、后台、指定工作目录;兼容本地 / SSH/Docker 远端终端;process:后台进程管理:查看、等待、杀死异步任务;- 场景:编译项目、服务启停、批量运维脚本、Git 操作。
3. web 网络搜索工具集
工具:web_search、web_extract
web_search:全网检索(支持 Tavily/Firecrawl 后端);web_extract:抓取网页正文、自动转 Markdown,去除广告;- 场景:资料调研、行业文档抓取、实时资讯查询。
4. browser 无头浏览器自动化工具集(12 个内置工具)
工具:browser_navigate、browser_click、browser_input、browser_scroll、browser_vision、browser_screenshot、browser_wait、browser_download等
- 能力:完整 CDP 无头浏览器,模拟人工点击、输入、截图、OCR、页面视觉分析;
- 场景:自动化填报、网页数据爬取、表单批量提交、网页截图归档。
5. vision + image_gen多媒体视觉工具集
- vision:图片 OCR 识别、图像内容理解、截图解析;
- image_gen:文生图、图生图生成; 配套
/image斜杠命令上传本地图片分析。
6. cronjob 定时调度工具集(你重点关注)
内置全套定时任务底层工具,对应会话内/cron系列斜杠命令:
cron_create:创建定时任务,接收标准 Cron 表达式;cron_list:查询全部任务、下次执行时间;cron_pause/resume/remove/run:暂停、恢复、删除、手动执行任务;cron_status:调度服务健康检查;- 持久化:任务存入本地数据库,Hermes 后台常驻即可自动触发。
7. memory 跨会话记忆工具集
工具:memory_store、memory_recall
- 持久存储关键信息,跨会话不丢失;
- 区分临时对话上下文与长期记忆;
- 搭配
session_search:检索历史全部对话记录。
8. code_execution 代码运行工具集
工具:execute_code
- 沙箱执行 Python/JS 代码;
- 支持数据计算、CSV/JSON 处理、简单绘图;
- 隔离沙箱,禁止高危系统操作。
9. delegation 子智能体编排工具集
核心工具delegate_task
- 自动拆分复杂任务,生成独立子 Agent 处理细分工作;
- 子 Agent 拥有隔离上下文、独立工具权限;
- 支持多层递归委派、多任务并行执行、结果聚合;
- 场景:多源数据并行调研、复杂方案分步拆解。
10. messaging 消息推送工具集
内置多平台消息发送:飞书、钉钉、Discord、Slack、Telegram;
工具send_message:定时任务完成、告警、报表自动推送。
11. tts 语音工具集
text_to_speech:文本转语音朗读,支持 Edge TTS、ElevenLabs;对应/voice斜杠指令。
12. todo 任务规划工具集
会话内轻量化任务看板,创建、标记、查询待办事项,用于复杂任务分步跟踪。
13. clarify 交互澄清工具
模型自动调用,当需求模糊时主动向用户提问补全信息,减少幻觉。
14. skills 技能管理工具集
工具:skills_list、skill_view、skill_create、skill_patch、reload_skills
- 管理自定义封装工作流技能;
- 对应会话斜杠
/skills、/reload。
15. safe 只读安全工具集
仅开放文件读取、网页查询,禁用写入 / 终端执行,用于安全只读会话。
三、扩展配套平台工具集(非默认,按需启用)
- rl 训练工具集:大模型微调、LoRA 训练、指标监控(需 TINKER/WandB 密钥);
- homeassistant 智能家居工具集:HA 设备控制、状态查询;
- kanban 看板工具集:内置项目任务看板管理;
- spotify/yuanbao/feishu:第三方平台专属工具集;
- computer_use:桌面自动化(macOS 后台键鼠控制)。
四、MCP 外部工具(不属于 Hermes 原生内置,补充区分)
Hermes 支持 MCP 协议接入第三方服务,不属于自带工具集,需手动配置:
- 文件 MCP、数据库 MCP、GitHub/GitLab、日历、企业内部 API;
- 启动命令
hermes mcp serve可把 Hermes 自身暴露为 MCP 服务给 Cursor、VSCode 调用。
五、工具集管理操作(Hermes 会话内斜杠命令)
/tools:查看当前已启用全部内置工具集、开关状态;/reload:重载所有工具集、技能、MCP 配置;/debug:开启工具调用完整日志,查看模型调用了哪些内置工具;/status:查看当前会话允许的工具集白名单。
六、内置工具集 vs 斜杠命令 / 自然语言 三层关系
- 底层:内置工具函数(模型自动调用,无用户感知);
- 中层:/ 斜杠命令(用户手动快捷入口,直接映射工具集能力,不走 LLM 推理);
/cron→ 调用 cronjob 工具集;/model→ 切换模型配置工具;/clear→ 清空 memory 临时上下文;
- 上层:自然语言(模型理解需求,自动选择对应内置工具执行)。
七、内置工具集核心特点
- 开箱即用:安装 Hermes 后无需额外部署,CLI 交互模式默认全加载;
- 权限隔离:工具集可单独禁用,关闭终端 / 文件写入可提升安全性;
- 调度联动:
cronjob定时工具可串联文件、终端、消息推送工具,实现自动化流水线; - 可观测:
/debug日志完整记录每一次工具调用参数、返回结果; - 无幻觉:内置工具为固定底层函数,执行结果确定性强,不会出现语义偏差。
八、典型业务流水线示例(多内置工具集联动)
/cron create "0 0 8 * * ?" 每日生成业务报表- 定时触发 →
terminal执行数据导出脚本 →file写入 Excel 报表 →web_extract抓取行业数据补充 →send_message推送飞书报表。 整条链路全部由 Hermes 原生内置工具集完成,无需外部插件。
