Anthropic关于构建Agent Skills的思考解读

Anthropic在最新的Blog文章《Building Agents with Skills: Equipping agents for specialized work》中，分享了他们关于「不要构建专业Agent，而是构建Skills」的思考。

新范式：Code is all you need

过去行业普遍认为“不同领域需要不同的Agent”，比如编程智能体、研究智能体、金融智能体、营销智能体，这些Agent在形态、工具和架构上完全不同。

因此早期的主流做法是：按领域垂直定制Agent。

随着模型更聪明和Agent能力变强（规划、多步执行、调用工具等），现在逐渐转向了另外一种方法：

将Code视为一种界面，通过「通用Agent+Coding」，Agent几乎能完成任何领域工作，而不仅仅是一个用例。

所以，真正的差异化不在Agent本体，而是知识、流程、最佳实践的沉淀。

与其打造垂类Agent，不如打造一个足够强的通用Agent，让Coding来操作一切接口，就能覆盖几乎所有工作场景。

举个例子：

Claude Code是一个编程智能体，也是一个通过代码运作的通用智能体。

比如使用Claude Code来生成财务报告：调用API进行调研、存储数据在文件系统中，使用Python分析数据，综合得出见解。

这些操作都是通过Coding实现的。

该Agent架构很简单，只需要bash和文件系统即可。

Skills: 扩展领域专业知识

通过Coding可以实现各种功能，但能力不等于专业。

也就是说，与其让一个不懂财务的数学天才帮你报税，你更希望找个报过几千份税的老会计。

这不是比智力，还需要专业度。

针对当前的痛点：Agent缺少重要背景信息、难以吸收组织的专业经验、也不会从重复任务中自动学习。

因此，Anthropic设计出了Skills，通过将领域专业知识打包成Agent可以逐步访问和调用的格式，比如工作流、模板、规范、脚本、最佳实践等。

Skills具有如下3个特点：

1. 设计简单

Skills = 把“领域知识 + 操作流程”打包成文件，让 Agent 像查资料一样调用。

anthropic_brand/├── SKILL.md├── docs.md├── slide-decks.md└── apply_template.py

如上Skills文件，构建非常简单，不仅是工程师，产品经理、分析师和领域专家都在构建Skills来编码化他们的工作流程。

2. 渐进式披露

Skills包含大量信息，为了保护上下文窗口，Skills采用渐进式加载：

① 在运行时，只给模型看元数据（名称和描述，约50tokens）；

② 如果Agent判断需要，才读取完整的SKILL.md文件（约500tokens）；

③ 如果还需要更多细节，再加载references目录中的其他资料；

这种「元数据-完整文件-支持文件」的三层设计方法，可以为Agent配备成百上千项专业技能，而不会导致上下文过载。

我认为这是Skills的最大亮点，既规模化扩展Agent能力，又不牺牲性能。

3. 可以包含脚本工具

传统工具调用存在一个核心问题：如果说明写的不好，模型无法总是修改或扩展，且占上下文；

而代码是自解释的、可修改的，并且不需要始终处于上下文中；

比如，Claude经常重复地编写脚本给PPT套品牌样式，那么就可以将其沉淀为可复用能力apply_template.py：

# anthropic/brand_styling/apply_template.pyimport sys from pptx import Presentationif len(sys.argv) != 2:    print("USAGE: apply_template.py <pptx>")    sys.exit(1)prs = Presentation(sys.argv[1])for slide in prs.slides:...

在 slide-decks.md 中直接引用该脚本即可：

## Anthropic Slide Decks- Intro/outro slides  - background color: `#141413`  - foreground color: oat
Use the `./apply_template.py` script to update a pptx file in-place.

Skills的生态系统

目前Skills主要可以分为三大类：

基础技能

通用的共性需求。比如几乎所有知识工作者都会用到的处理文档、Excel、PPT等。

将最佳实践变成可复用文件，可以在github的公共仓库中查看：

https://github.com/anthropics/skills/tree/main/skills

合作伙伴技能

Skill标准化了Agent与专业能力之间的交互方式，就如同2025年初的MCP标准化了工具调用协议，如今各企业也都在构建自己的垂类技能库。

比如K-Dense（科研）、Browserbase（浏览器）、Notion（知识库）等，官方提供能够直接集成他们服务的Skills。

第三方服务，不仅可以扩展Claude的能力边界，服务商也获得了流量入口。

企业技能

将企业内部知识与流程产品化。

这些Skills通常是私有的、高度定制的，比如内部审批流程、合规模板、操作手册、历史经验总结等。

将这些流程和领域专业知识进行打包，相当于将老员工的经验和散落在各处的文档，封装成可调用的Skills。

Skills趋势与规划

随着Skills采用的增长，一些模式逐渐浮现，Anthropic对于Skills的设计和支持工具，有3点趋势思考：

增加复杂性

早期的技能只是简单的文档引用，现在Skill演变成复杂的多步骤工作流程。

这些工作流程可以协调数据检索、复杂的计算和跨多个工具的格式化输出。

Skills与MCP协同

Skills与MCP服务互相协同工作。

比如一份竞品分析的Skill，通过MCP协调网络检索、内部数据库、Slack消息历史和Notion页面，从而生成全面的报告。

两者如何协同详见这篇文章：

https://claude.com/blog/extending-claude-capabilities-with-skills-mcp-servers

非开发者应用

Skills创建很简单，人人都可以使用Claude Code或Skill创建工具在30分钟内创建并测试自己的第一个Skill。

Skills生态及支持工具的繁荣，让任何人都能捕获和分享专业知识。

完整的Agent系统架构

首先，看下使用Skills后的Agent架构组成部分：

Agent Loop：智能体循环，决定下一步做什么的核心推理系统
Agent Runtime：智能体运行时，执行环境（代码、文件系统）
MCP Servers：MCP服务，与外部工具和数据源连接
Skills Library：技能库，领域专业知识和程序性知识

如图所示，最新的Agent架构是由「决策层+执行层+工具连接层+专业技能库」四层组合而成。

每一层都有明确的目的：循环推理，运行时执行，MCP连接，Skills指导。

这种模块化架构使系统易于理解且允许独立迭代。

{{userData.name}}已认证

Anthropic关于构建Agent Skills的思考解读

基础技能

合作伙伴技能

企业技能

增加复杂性

Skills与MCP协同

非开发者应用

🤯 终于搞懂了！LLM、RAG 和 AI Agents 到底是什么关系？

"自拍" 秒变 "证件照" 看Coze如何实现