Anthropic关于构建Agent Skills的思考解读


Anthropic在最新的Blog文章《Building Agents with Skills: Equipping agents for specialized work》中,分享了他们关于「不要构建专业Agent,而是构建Skills」的思考。

新范式:Code is all you need


过去行业普遍认为“不同领域需要不同的Agent”,比如编程智能体、研究智能体、金融智能体、营销智能体,这些Agent在形态、工具和架构上完全不同。

因此早期的主流做法是:按领域垂直定制Agent。

随着模型更聪明和Agent能力变强(规划、多步执行、调用工具等),现在逐渐转向了另外一种方法:

将Code视为一种界面,通过「通用Agent+Coding」,Agent几乎能完成任何领域工作,而不仅仅是一个用例。

Anthropic关于构建Agent Skills的思考解读

所以,真正的差异化不在Agent本体,而是知识、流程、最佳实践的沉淀。

与其打造垂类Agent,不如打造一个足够强的通用Agent,让Coding来操作一切接口,就能覆盖几乎所有工作场景。

举个例子:

Claude Code是一个编程智能体,也是一个通过代码运作的通用智能体。

比如使用Claude Code来生成财务报告:调用API进行调研、存储数据在文件系统中,使用Python分析数据,综合得出见解。

这些操作都是通过Coding实现的。

该Agent架构很简单,只需要bash和文件系统即可。

Skills: 扩展领域专业知识


通过Coding可以实现各种功能,但能力不等于专业。

也就是说,与其让一个不懂财务的数学天才帮你报税,你更希望找个报过几千份税的老会计。

这不是比智力,还需要专业度。

针对当前的痛点:Agent缺少重要背景信息、难以吸收组织的专业经验、也不会从重复任务中自动学习

因此,Anthropic设计出了Skills,通过将领域专业知识打包成Agent可以逐步访问和调用的格式,比如工作流、模板、规范、脚本、最佳实践等。

Skills具有如下3个特点:

1. 设计简单

Skills = 把“领域知识 + 操作流程”打包成文件,让 Agent 像查资料一样调用。

anthropic_brand/├── SKILL.md├── docs.md├── slide-decks.md└── apply_template.py

如上Skills文件,构建非常简单,不仅是工程师,产品经理、分析师和领域专家都在构建Skills来编码化他们的工作流程。

2. 渐进式披露

Skills包含大量信息,为了保护上下文窗口,Skills采用渐进式加载

① 在运行时,只给模型看元数据(名称和描述,约50tokens);

Anthropic关于构建Agent Skills的思考解读

② 如果Agent判断需要,才读取完整的SKILL.md文件(约500tokens);

③ 如果还需要更多细节,再加载references目录中的其他资料;

这种「元数据-完整文件-支持文件」的三层设计方法,可以为Agent配备成百上千项专业技能,而不会导致上下文过载。

我认为这是Skills的最大亮点,既规模化扩展Agent能力,又不牺牲性能。

3. 可以包含脚本工具

传统工具调用存在一个核心问题:如果说明写的不好,模型无法总是修改或扩展,且占上下文;

而代码是自解释的、可修改的,并且不需要始终处于上下文中;

比如,Claude经常重复地编写脚本给PPT套品牌样式,那么就可以将其沉淀为可复用能力apply_template.py:

# anthropic/brand_styling/apply_template.pyimport sys from pptx import Presentationif len(sys.argv) != 2:    print("USAGE: apply_template.py <pptx>")    sys.exit(1)prs = Presentation(sys.argv[1])for slide in prs.slides:...

在 slide-decks.md 中直接引用该脚本即可:

## Anthropic Slide Decks- Intro/outro slides  - background color: `#141413`  - foreground color: oat
Use the `./apply_template.py` script to update a pptx file in-place.


Skills的生态系统


目前Skills主要可以分为三大类:

  1. 基础技能

通用的共性需求。比如几乎所有知识工作者都会用到的处理文档、Excel、PPT等。

将最佳实践变成可复用文件,可以在github的公共仓库中查看:

https://github.com/anthropics/skills/tree/main/skills

  1. 合作伙伴技能

Skill标准化了Agent与专业能力之间的交互方式,就如同2025年初的MCP标准化了工具调用协议,如今各企业也都在构建自己的垂类技能库。

比如K-Dense(科研)、Browserbase(浏览器)、Notion(知识库)等,官方提供能够直接集成他们服务的Skills。

第三方服务,不仅可以扩展Claude的能力边界,服务商也获得了流量入口。

  1. 企业技能

将企业内部知识与流程产品化。

这些Skills通常是私有的、高度定制的,比如内部审批流程、合规模板、操作手册、历史经验总结等。

将这些流程和领域专业知识进行打包,相当于将老员工的经验和散落在各处的文档,封装成可调用的Skills。

Skills趋势与规划


随着Skills采用的增长,一些模式逐渐浮现,Anthropic对于Skills的设计和支持工具,有3点趋势思考:

  1. 增加复杂性

早期的技能只是简单的文档引用,现在Skill演变成复杂的多步骤工作流程。

这些工作流程可以协调数据检索、复杂的计算和跨多个工具的格式化输出。

Anthropic关于构建Agent Skills的思考解读

  1. Skills与MCP协同

Skills与MCP服务互相协同工作。

比如一份竞品分析的Skill,通过MCP协调网络检索、内部数据库、Slack消息历史和Notion页面,从而生成全面的报告。

两者如何协同详见这篇文章:

https://claude.com/blog/extending-claude-capabilities-with-skills-mcp-servers

  1. 非开发者应用

Skills创建很简单,人人都可以使用Claude Code或Skill创建工具在30分钟内创建并测试自己的第一个Skill。

Skills生态及支持工具的繁荣,让任何人都能捕获和分享专业知识。

完整的Agent系统架构


首先,看下使用Skills后的Agent架构组成部分:

  • Agent Loop:智能体循环,决定下一步做什么的核心推理系统

  • Agent Runtime:智能体运行时,执行环境(代码、文件系统)

  • MCP Servers:MCP服务,与外部工具和数据源连接

  • Skills Library:技能库,领域专业知识和程序性知识

Anthropic关于构建Agent Skills的思考解读

如图所示,最新的Agent架构是由「决策层+执行层+工具连接层+专业技能库」四层组合而成。

每一层都有明确的目的:循环推理,运行时执行,MCP连接,Skills指导。

这种模块化架构使系统易于理解且允许独立迭代。

前沿技术大模型技术新闻资讯

🤯 终于搞懂了!LLM、RAG 和 AI Agents 到底是什么关系?

2026-4-30 0:28:52

Agent智能体coze新闻资讯

"自拍" 秒变 "证件照" 看Coze如何实现

2026-4-30 0:34:59

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
购物车
优惠劵
搜索