当前位置：首页 > news >正文

AI Skill：AI技能

news 2026/6/1 3:38:41

一句话解释

AI Skill，或者更准确地说 Agent Skill，是给 AI Agent 使用的可复用能力包：它把任务说明、触发条件、操作步骤、参考资料、模板、脚本和资源文件组织在一起，让 Agent 在遇到特定任务时自动加载并按稳定流程完成工作。

如果说 Prompt 是“这一次你该怎么回答”，Tool 是“你可以调用这个外部能力”，MCP Server 是“你可以连接这些工具和数据源”，那么 Skill 更像“这类任务我们团队通常怎么做，请按这套手册执行”。

本文中的 Skill 特指 2025 年之后在大模型 Agent 生态中出现的“AI 技能 / Agent Skills”概念，不是泛泛地说人类需要掌握的 AI 技能。

为什么最近变火

Skill 变热，和 Agent 的发展直接相关。

早期大模型应用主要是问答和文本生成。用户把要求写进 prompt，模型根据上下文回答。这个阶段最重要的是提示词写得清楚。

但到 2024-2026 年，主流 AI 应用开始进入更复杂的形态：Agent 可以读文件、写文件、运行代码、调用工具、操作浏览器、连接企业系统、执行多步骤任务。问题也随之出现：一个通用 Agent 虽然能力很强，但它并不知道你的团队如何写周报、如何审合同、如何生成客户简报、如何检查代码、如何遵循内部风格指南。

也就是说，模型具备通用智能，但缺少具体组织的“做事方法”。

2025 年 10 月，Anthropic 发布 Agent Skills，把 Skill 描述为一种用文件夹组织说明、脚本和资源的方式，用来给 Claude 提供特定领域的流程知识和组织上下文。2025 年 12 月，Agent Skills 被发布为开放标准，强调跨平台可移植性。到 2026 年，OpenAI 也在 ChatGPT、Codex 和 API 相关文档中介绍 Skills，说明 Skill 可以把可复用工作流打包起来，让 ChatGPT 或 Codex 在需要时使用。

这让 Skill 从某个产品功能，逐渐变成 Agent 生态里的一类通用抽象。

它变火有几个深层原因。

第一，重复 prompt 不可维护。很多团队会反复粘贴同一段写作要求、报告模板、代码规范、审查流程。短期可行，长期会变成混乱的“提示词复制粘贴文化”。

第二，企业需要一致性。AI 生成内容不只是“能回答”就够了，还要符合品牌语气、格式标准、合规边界、审批流程和数据引用规则。

第三，Agent 需要程序化知识。很多真实任务不是一次回答，而是有步骤、有判断、有校验、有工具调用顺序的流程。Skill 正好可以把这些流程沉淀成可复用资产。

第四，Context Engineering 需要载体。前一篇文章讲过，上下文工程的关键是让模型在正确时刻看到正确信息。Skill 就是一种把上下文打包、按需加载、可版本管理的方式。

第五，AI 编程和办公自动化越来越像“让 Agent 加入团队”。当 Agent 被用于长期协作时，团队自然会想给它一本手册：我们的代码怎么审、周报怎么写、事故复盘怎么做、客户邮件怎么措辞。Skill 就是这本手册的可执行版本。

它解决了什么问题

重复解释：同一类任务每次都要重新写 prompt，浪费时间且容易漏步骤。
输出不一致：不同用户、不同会话、不同模型生成的格式和质量不稳定。
组织知识难复用：团队流程、模板、风格指南、领域规则散落在文档和人的经验里。
上下文过长：把所有规则都塞进系统提示或对话历史，会增加 token 成本并干扰模型。
工具使用不稳定：Agent 知道有工具，但不知道该按什么顺序查数据、如何校验结果。
新成员上手慢：人类新员工需要 onboarding，Agent 也需要了解团队工作方式。
流程不可审计：如果流程只存在于一次性 prompt 中，很难版本控制、评审和改进。
从原型走向生产困难：AI 工作流要进入业务系统，必须有可复用、可测试、可治理的流程资产。

Skill 的目标不是让模型“凭空学会新知识”，而是把人类已经总结出的做事方法交给 Agent，让它在推理时按需使用。

核心概念

1. Skill 是能力包，不是模型参数

Skill 不会直接改变模型权重，也不是微调。它通常是在推理时被 Agent 发现、读取和执行的外部资源。

这点很重要。很多人听到“给 AI 一个技能”，会误以为模型真的永久学会了某种能力。更准确的理解是：Agent 拿到了一份可重复使用的任务手册，必要时会打开手册照着做。

2. SKILL.md 是入口文件

在 Agent Skills 标准和 Claude Skills 体系里，一个 Skill 通常以一个文件夹存在，核心入口是SKILL.md。这个文件一般包含两部分：

YAML frontmatter：写明name、description等元数据；
Markdown 正文：写明任务步骤、输入要求、输出格式、注意事项和示例。

一个简化的 Skill 目录可能长这样：

ai-blog-writer/ ├── SKILL.md ├── references/ │ ├── style-guide.md │ └── fact-checking.md ├── templates/ │ └── article-outline.md └── scripts/ └── check_markdown.py

SKILL.md是 Agent 识别和加载 Skill 的入口。其他文件则提供更细的参考资料、模板或可执行脚本。

3. Metadata：让 Agent 知道什么时候该用

Skill 的name和description不只是给人看的，也是给 Agent 做选择的。

例如：

---name:ai-blog-writerdescription:Write Chinese AI learning blog posts with clear structure,factual references,Mermaid diagrams,and final Markdown checks. Use when creating or revising AI concept articles.---

这里的description要说明两件事：

这个 Skill 做什么；
什么情况下应该使用它。

如果描述太宽泛，比如“helps with writing”，Agent 很难判断什么时候该触发。好的 Skill 描述应该包含具体任务、领域关键词和触发场景。

4. Progressive Disclosure：渐进式披露

Skill 最关键的设计思想是渐进式披露。

Agent 不会在启动时把所有 Skill 的全部内容都塞进上下文。通常流程是：

启动时只加载每个 Skill 的name和description；
当用户任务匹配某个 Skill 时，再读取该 Skill 的SKILL.md；
如果SKILL.md引用了其他资料或脚本，Agent 再按需读取或执行。

这样做的好处是：你可以安装很多 Skill，但上下文窗口里只放当前任务真正需要的内容。它把“可用知识很多”和“当前上下文简洁”这两个目标同时兼顾起来。

5. Resources：参考资料和模板

Skill 可以包含参考文档、示例、模板、数据结构、格式规范、品牌指南、审查清单等资源。

例如一个“合同审查 Skill”可能包含：

常见风险条款说明；
公司标准 fallback 条款；
合同审查输出模板；
不同司法辖区的注意事项；
最终检查清单。

这些资源不一定每次都要全部加载。Agent 可以根据任务只读取相关部分。

6. Scripts：确定性脚本

Skill 还可以包含脚本。脚本适合处理那些模型不该靠自然语言“猜”的事情，例如：

校验 Markdown 链接；
解析 PDF 表单字段；
生成图表；
检查 JSON schema；
批量转换文件格式；
运行固定的数据清洗流程。

这也是 Skill 和普通 prompt 的重要区别。Prompt 主要提供语言指令；Skill 可以把说明和可执行代码打包在一起，让 Agent 在合适时候运行脚本，获得更稳定的结果。

7. Skill 是上下文工程资产

从上下文工程角度看，Skill 是一种“可版本管理的上下文包”。它把原本散落在 prompt、文档、脚本和人的经验里的内容，整理成一个可加载、可共享、可迭代的结构。

它不是越大越好。一个好的 Skill 应该聚焦：

触发条件明确；
主文件简洁；
复杂细节拆到引用文件；
脚本职责清楚；
输出格式可检查；
安全边界写明。

工作原理

一个典型 Skill 的运行过程可以理解为“发现、激活、加载、执行、反馈”。

可以把它拆成五个步骤。

1. 发现

Agent 启动或会话开始时，系统会让它知道有哪些 Skill 可用。通常不会加载完整内容，只加载轻量级元数据。

这类似一个目录页：Agent 不需要读完整本书，只要先知道书架上有哪些书。

2. 选择

当用户提出任务时，Agent 根据用户请求和 Skill 描述判断是否需要使用某个 Skill。

例如用户说“请把这些会议纪要整理成我们团队周报格式”，Agent 可能会选择weekly-status-reportSkill；如果用户说“检查这份 PR 是否符合我们的发布规范”，Agent 可能会选择release-reviewSkill。

3. 加载

一旦 Skill 被选中，Agent 读取SKILL.md。这个文件进入上下文，成为当前任务的一部分。

如果SKILL.md提到“需要时查看references/style-guide.md”，Agent 可以继续读取对应文件。这样可以避免把所有细节一次性塞进上下文。

4. 执行

Agent 按 Skill 的说明完成任务。这个过程可能包括写作、分析、调用工具、读取文件、运行脚本、生成文档、检查格式等。

如果 Skill 包含脚本，Agent 可以运行脚本，把输出结果作为观察信息继续处理。

5. 反馈和迭代

Skill 不应该写完就不再改。真实使用中，你会发现：

某些触发条件太宽；
某些步骤不够明确；
某些输出格式经常漏字段；
某些脚本错误信息不友好；
某些资源文件太长，导致上下文浪费。

这些反馈应该回到 Skill 本身。好的 Skill 会随着团队实践不断迭代，就像代码和文档一样。

如何设计一个好的 Skill

Skill 写得好不好，不取决于文字多不多，而取决于 Agent 能否在正确场景下稳定使用它。可以从五个角度设计。

1. 触发边界要窄

一个 Skill 最好解决一类明确任务。例如“生成客户简报”“审查 Markdown 技术文章”“排查 Python 单元测试失败”。如果 Skill 描述成“帮助完成所有办公任务”，Agent 很难判断什么时候该用，也容易和其他 Skill 冲突。

好的触发描述通常包含：

任务领域；
输入类型；
期望输出；
适用场景；
不适用场景。

2. 主流程要短，细节要拆

SKILL.md应该像入口说明，而不是百科全书。主流程可以保持 5-8 步，复杂规则放进references/，模板放进templates/，确定性检查放进scripts/。

这样做有两个好处：

Agent 当前上下文更轻，不会被大量细节干扰；
后续维护更清楚，改模板、改脚本、改流程不会搅在一起。

3. 输出要可检查

Skill 的价值之一是让结果稳定。因此最好明确输出结构，例如：

必须包含哪些标题；
哪些字段不能为空；
是否需要引用来源；
是否需要表格；
是否需要最后检查清单；
失败时应该如何说明。

如果输出无法检查，就很难知道 Skill 是否真的提高质量。

4. 脚本只做确定性工作

脚本适合做模型不该凭感觉完成的事情：格式校验、链接检查、JSON schema 校验、代码测试、批量转换、指标计算。脚本不应该偷偷做高风险动作，例如未经确认发送邮件、删除文件、上传敏感数据。

可以把 Skill 中的能力分成三类：

类型	适合放在哪里	例子
判断和解释	`SKILL.md`	如何分析文章结构、如何写结论
稳定模板	`templates/`	报告模板、PR 模板、复盘模板
确定性检查	`scripts/`	Markdown 检查、单元测试、链接扫描

5. 需要评测样例

一个生产级 Skill 最好带一组小型 eval：

3-5 个典型输入；
1-2 个边界输入；
期望输出样例；
自动检查脚本；
人工评分标准。

这样每次改 Skill 后，都能确认它没有让结果变差。Skill 越接近生产流程，越应该像代码一样被版本控制、评审和回归测试。

典型应用场景

1. 文档生成和办公自动化

这是 Skill 最早、最自然的场景之一。比如生成 PowerPoint、Excel、Word、PDF、周报、复盘、会议纪要、项目计划、客户简报。

这类任务通常有固定结构，但每次输入不同。Skill 可以把结构、语气、格式、检查清单和模板固定下来。

2. AI 编程助手

编程 Agent 可以用 Skill 学会团队的工程习惯：

PR 描述格式；
单元测试写法；
错误排查流程；
发布检查清单；
前端视觉验收流程；
数据库迁移规范；
安全审查规则。

这比每次提醒“请遵循我们的代码规范”更可靠，因为 Skill 可以把规范、示例、脚本和校验步骤放在一起。

3. 企业知识工作

企业里很多任务不是纯创作，而是“按流程整合信息”：

销售团队生成客户健康度报告；
客服团队整理升级问题；
财务团队解释预算差异；
法务团队做合同风险摘要；
HR 团队生成面试题和评估表。

这些流程往往包含内部术语、审批要求、输出模板和数据来源顺序。Skill 适合把这套经验固化。

4. 数据分析和报告

数据分析 Skill 可以规定：

先检查数据字段和缺失值；
再说明假设；
再生成统计结果；
最后输出图表、结论和限制。

如果 Skill 里包含脚本，还可以固定数据清洗、指标计算和格式校验方式，减少模型凭感觉处理数据的风险。

5. 安全、合规和审计

在高风险场景中，Skill 可以把“不该做什么”也写进去。例如：

不输出个人敏感信息；
不把低可信来源当成事实；
高风险操作必须要求人工确认；
引用企业政策必须列出来源；
输出前必须通过检查清单。

不过，Skill 本身不是安全系统。它可以帮助 Agent 遵循流程，但仍然需要权限控制、日志审计、沙箱和人工审核配合。

6. 学习和内容创作

对个人学习者来说，Skill 可以把自己的学习偏好沉淀下来。例如：

写 AI 概念博客时先讲背景，再讲工作原理；
必须列出参考资料；
需要时加入 Mermaid 图；
避免营销式表达；
结尾提供小结和延伸问题。

你现在写的这个 AI 系列博客，本质上就很适合沉淀成一个ai-learning-blog-writerSkill。

和其他概念的区别

概念	核心含义	和 Skill 的关系
Prompt	单次输入中的指令	Skill 可以把反复使用的 prompt 变成可复用流程
System Prompt	全局行为规则	Skill 更偏任务级，按需加载，不一定全局常驻
Custom GPT	面向某个目标定制的助手	Custom GPT 更像一个定制助手，Skill 更像可复用能力模块；能否组合取决于具体产品支持
Tool / Function Calling	调用某个函数或 API	Tool 提供动作，Skill 教 Agent 何时、为何、按什么流程使用动作
Plugin	连接外部应用或数据源	Plugin 负责连接，Skill 负责流程；二者可以配合
MCP Server	标准化暴露工具、资源和提示	MCP 提供连接协议，Skill 可以说明如何使用这些连接完成任务
RAG	检索外部知识放入上下文	Skill 可以规定检索策略、引用格式和回答流程
Workflow	多步骤流程编排	Skill 可以描述可复用工作流，也可以被工作流调用
Memory	长期保存偏好或事实	Skill 是明确打包的流程资产，Memory 更像长期个人化信息
Fine-tuning	更新模型参数	Skill 不改模型参数，而是在推理时提供流程和资源

Skill 和 Tool 的区别

Tool 更像一个“按钮”或“函数”。例如：

查询数据库；
发送邮件；
运行测试；
创建日历事件；
搜索网页。

Skill 更像一套“操作手册”。它会告诉 Agent：

什么时候该查数据库；
查哪些字段；
查完如何判断结果；
是否需要再查另一个系统；
最后用什么格式写报告；
输出前做哪些检查。

所以 Tool 解决“能不能做某个动作”，Skill 解决“怎样把动作组织成可靠任务”。

Skill 和 MCP 的区别

MCP 关注连接层。它让模型应用用标准方式访问工具、数据源和上下文资源。

Skill 关注流程层。它告诉 Agent 如何完成某类任务。

一个常见组合是：

例如一个客户简报 Skill 可以规定“先查 CRM，再查最近会议纪要，再查使用量数据，最后按客户成功模板输出”。而 CRM、会议纪要和使用量数据可能分别由不同 MCP Server 提供。

一个简单例子

假设你想把“AI 概念博客写作流程”做成 Skill。目标是以后每次写 AI 热词文章时，不用重复说明结构和风格。

一个简化的SKILL.md可以这样写：

--- name: ai-concept-blog description: Write Chinese AI concept blog posts for learners. Use when the user asks for an AI history or AI hotword article in Markdown. --- # AI Concept Blog Skill ## Goal Write clear Chinese Markdown articles for AI learners. ## Process 1. Identify whether the topic is historical or a modern AI concept. 2. For recent concepts, verify facts using official docs, papers, or reputable sources. 3. Explain why the concept appeared, what problem it solves, and how it relates to nearby concepts. 4. Add Mermaid diagrams or tables only when they improve understanding. 5. End with a concise summary and reference links. ## Output Structure Use this structure for modern AI concepts: - 一句话解释 - 为什么最近变火 - 它解决了什么问题 - 核心概念 - 工作原理 - 典型应用场景 - 和其他概念的区别 - 一个简单例子 - 常见误解 - 未来趋势 - 小结 - 参考资料 ## Final Checks - Markdown headings are consistent. - Mermaid blocks are closed. - References are listed for factual claims. - Avoid marketing language.

这个 Skill 做的事情并不神秘：它把你原本会反复写进 prompt 的要求，变成一个结构化、可复用、可修改的能力包。

如果以后你再说“下一篇写某个 AI 热词”，Agent 就可以自动使用这个 Skill，按同样标准生成文章。

常见误解

误解 1：Skill 会让模型真正学会新能力

Skill 不等于训练模型。它通常是在推理时提供说明、资源和脚本，让 Agent 能按流程完成任务。

如果模型本身完全无法理解某个领域，Skill 也不能奇迹般解决问题。Skill 更擅长把“已有知识和流程”组织起来，而不是替代模型能力本身。

误解 2：Skill 就是高级 prompt

Skill 可以包含 prompt，但不只是 prompt。

一个成熟 Skill 可能包含：

入口说明；
触发条件；
多步骤流程；
输出模板；
参考资料；
可执行脚本；
示例输入输出；
校验清单；
安全边界。

这更接近一个轻量软件包，而不是一段聊天文本。

误解 3：Skill 越多越好

不一定。Skill 太多会带来选择困难、命名冲突、触发条件重叠和维护成本。

好的做法是把 Skill 做小、做准、做可组合。一个 Skill 最好解决一类清晰任务，而不是试图包办整个部门的所有工作。

误解 4：有了 Skill 就不需要评估

Skill 必须评估。你需要知道它是否真的提高成功率、是否引入错误、是否让 Agent 过度依赖某个流程。

2026 年的 SkillsBench 论文报告了一个值得注意的现象：人工整理的 focused skills 在不少任务上能提高通过率，但自生成 Skill 并不总是带来收益，甚至可能在某些任务上拖累表现。这个结果提醒我们，Skill 不是“写了就有效”，它需要测试和迭代。

误解 5：Skill 可以替代权限和安全控制

不能。Skill 里可以写安全规则，但恶意 Skill 也可能诱导 Agent 执行危险操作、读取敏感文件或把数据发往外部系统。

使用 Skill 时要像安装软件一样谨慎：审查来源、阅读内容、检查脚本、限制权限、记录执行行为。

误解 6：Skill、插件和 MCP 是竞争关系

它们更多是互补关系。

插件和 MCP 解决“连接什么”；
Tool 解决“能执行什么动作”；
Skill 解决“按什么流程完成任务”；
Agent 负责根据目标选择、组合并执行这些能力。

真正强大的系统通常会把它们组合起来，而不是只选一个。

未来趋势

1. Skill 标准化和跨平台迁移

Agent Skills open standard 的意义在于：Skill 不再只是某个产品里的私有配置，而可能成为跨 Agent 产品共享的能力包格式。

截至 2026 年 5 月，这个生态仍在发展中，不同产品的支持范围、同步机制和运行环境并不完全一致。但方向很明确：开发者和团队希望“写一次流程，多处复用”。

2. Skill Marketplace 和企业知识库

未来可能会出现更多 Skill 市场、团队 Skill 库和企业内部 Skill 仓库。

这会带来两个结果：

好的工作流可以被分享、复用和版本化；
低质量或恶意 Skill 也可能扩散。

因此，Skill 生态会需要评分、审查、签名、权限声明和安全扫描。

3. Eval-Driven Skill Engineering

Skill 会越来越像代码一样被测试。团队可能会为重要 Skill 准备一组标准任务：

输入样例；
期望输出；
自动检查脚本；
人工评分标准；
回归测试。

每次修改 Skill 后，都跑一遍评估，确认它真的让 Agent 更可靠。

4. Agent 自我沉淀流程

未来 Agent 可能会在完成任务后自动总结经验，把成功步骤、失败教训和常见修复方式沉淀成新的 Skill 或更新已有 Skill。

但这个方向必须非常谨慎。自动生成的 Skill 可能包含错误经验、过拟合某次任务、泄露敏感信息，或者扩大权限边界。因此它需要人类审核和评估验证。

5. Skill + MCP + Context Engineering 组合成 Agent 栈

一个成熟 Agent 系统可能会呈现这样的结构：

MCP 提供标准化工具和数据连接；
Skill 提供任务流程和组织知识；
RAG 提供事实检索；
Memory 提供长期偏好和历史；
Workflow 提供状态流转和人工确认；
Evals 提供质量反馈。

Skill 在其中扮演的是“程序化知识层”：它让 Agent 不只是能调用工具，还知道如何按业务规则把工具串起来。

6. Skill 的安全和治理会变成重点

随着 Skill 可以运行脚本、访问文件、调用工具，它的风险会接近软件供应链风险。

未来可能会出现更严格的机制：

Skill 权限声明；
只读 / 可写 / 可联网限制；
脚本沙箱；
来源签名；
依赖扫描；
执行日志；
企业管理员分发和撤回。

这会决定 Skill 能否从个人效率工具进入严肃生产环境。

小结

AI Skill 是给 Agent 使用的可复用能力包，通常包含说明、元数据、资源、模板和脚本。
Skill 解决的是“如何稳定完成某类任务”，而不只是“模型能不能回答”。
2025 年 Anthropic 发布 Agent Skills 后，这个概念快速进入 Agent 生态；随后 Agent Skills open standard 和 OpenAI Skills 相关支持进一步推动了它的普及。
Skill 的核心机制是渐进式披露：先加载轻量元数据，任务匹配时再读取完整说明，需要时再读取资源或运行脚本。
Skill 和 Tool、Plugin、MCP 不同：Tool 提供动作，Plugin/MCP 提供连接，Skill 提供流程。
好的 Skill 应该聚焦、可组合、可评估、可版本管理，并明确安全边界。
Skill 本身不是安全系统，也不是模型微调；它仍然需要权限控制、评估和人工治理。
未来 Skill 很可能成为 Agent 系统中的基础组件，和 MCP、RAG、Memory、Workflow、Evals 一起组成更完整的 AI 应用栈。

参考资料

Anthropic,Equipping agents for the real world with Agent Skills, 2025: https://www.anthropic.com/engineering/equipping-agents-for-the-real-world-with-agent-skills
Claude Docs,Agent Skills: https://platform.claude.com/docs/en/agents-and-tools/agent-skills/overview
Agent Skills,Overview: https://agentskills.io/home
Agent Skills,Specification: https://agentskills.io/specification
OpenAI Help Center,Skills in ChatGPT: https://help.openai.com/en/articles/20001066
OpenAI Academy,Using skills, 2026: https://openai.com/academy/skills/
OpenAI Academy,Plugins and skills, 2026: https://openai.com/academy/codex-plugins-and-skills/
Xiangyi Li et al.,SkillsBench: Benchmarking How Well Agent Skills Work Across Diverse Tasks, 2026: https://arxiv.org/abs/2602.12670
George Ling, Shanshan Zhong, Richard Huang,Agent Skills: A Data-Driven Analysis of Claude Skills for Extending Large Language Model Functionality, 2026: https://arxiv.org/abs/2602.08004