很多人以为自己卡在“怎么写 SKILL.md”,其实卡的是更底层的东西:总是将临时的提示词当成了可复用工作流。结果就是——同一类任务重复讲规则、输出漂、验收难;换模型、换工具都救不了。
反常识但很真实:AI 编程/写作落不了地,80% 不是模型不行,而是缺“可加载的工程化上下文”。而,Skill最近这么火,往往是解决了这方面痛点:它能把这些上下文做成“随用随取”的资产:流程、规范、脚本、模板、验收点,按需加载,稳定交付。
这篇文章,侧重讲Claude Skill 如何能做到工程化的,能让你更深入理解Skill,以及怎么用、何时用、如何落地。
-
阅读信息:预计 9 分钟|适用人群:小白/进阶
一、什么是 SKILL?
一句话先说清:Skill 是“模块化的能力包”:把指令(怎么做)、脚本(确定性执行)、资源(模板/参考)装进一个文件夹,让模型在需要时自动加载并按流程交付。
1)Skill 不是“更长的 Prompt”,而是“可复用工序”
Prompt 更像你当场对同事叮嘱:“注意 A、B、C、D…”。 Skill 更像你写好了 SOP:输入是什么、步骤怎么走、输出格式是什么、怎么自检、失败怎么回滚。
所以 Skill 的核心价值不是“写得漂亮”,而是把一次性经验固化成可复用资产:
-
可复用:同一类任务不用再重写规则 -
可验证:输出必须带自检清单/验收项(没自检=没交付) -
可控上下文:只在需要时加载相关技能,不把上下文炸穿
2)Skill 的结构为什么天然“生产级”?
Skill 的典型结构非常像一个“可分发模块”:
-
SKILL.md:核心指令(必需) -
scripts/:可执行脚本(可选,但强烈推荐用来做确定性工作) -
references/:详细参考(可选,用于把 SKILL.md 控制在合理长度) -
assets/:模板、示例、资源文件(可选)
这套结构最“值钱”的地方在于:它天然支持把“知识 + 执行”放在同一个可审计目录里。
3)渐进式披露:Skill 之所以能装很多,是因为它根本不一次性全加载
如果我装了 50 个 Skill,启动时都加载,Token 会不会直接爆炸啦?
答案是:不会。因为Skill加载分三层:
-
第一层:元数据(name/description):始终加载,成本低 -
第二层:指令正文(SKILL.md 主体):被触发时才加载 -
第三层:资源/脚本:被引用时才加载;脚本代码本身不进上下文,只有执行结果进上下文
这意味着 Skill 的正确姿势不是“写成论文”,而是:把高频流程写在 SKILL.md,把长尾细节放 references,把确定性动作放 scripts。
4)Skills vs Prompt vs MCP vs SubAgent:一套你说人话就能懂的分工
-
MCP:发工具(连接外部系统)解决“能访问什么数据/系统”(数据库、GitHub、Notion、各种 SaaS、API…)
-
Skills:使用手册(怎么做事/怎么用工具)解决“拿到数据之后应该怎么做、按什么标准做、交付什么格式”
-
Subagent:派助手(并行执行 + 上下文隔离)解决“复杂多步骤任务怎么拆、怎么并行干、怎么避免污染主对话”,再简单一点来说:它就是干活的人。
它们不是竞争关系,是可以组合的:MCP 拉数据 → Skill 按流程处理 → Subagent 并行跑多个分支完成任务。
很显然,“Skills 正在成为 Agent 能力扩展的事实标准”,它和 MCP 很像,但补的是另一块短板:流程资产化。
二、哪些人适合用?(带批判性思维:你别被热潮带跑了)
真正的大群体不是会自己构建 Skills 的那一小撮,而是“想用 AI 解决问题、又没能力从零创建工作流”的人。
请你记住:不是所有人、所有任务都值得上 Skill。核心是:看收益、看成本、看风险、看替代方案。
1)最适合用 Skill 的三类人
第一类:有固定工作流的人(重复规则多)判断标准:你是否经常说“每次都要强调同一套规则”。 典型场景:代码审查、TDD、上线检查、文章审校、报告生成、投标材料结构化输出。
第二类:团队协作的人(需要统一标准)判断标准:你是否在团队里反复解释规范,或者新人上手慢。 Skill 的价值在这里非常大:把口头规范变成“可触发的流程资产”。团队共享 Skill,等于共享 SOP。
第三类:Token 烧得多的人(上下文很长)判断标准:你是不是有很长的 CLAUDE.md / 系统提示,每次对话都要加载大量“其实本次用不到”的规则。 Skill 的渐进式披露可以直接降成本:常态只加载元数据,需要时再加载指令。
2)不适合用 Skill 的情况(别硬上)
一次性任务:写个临时文案、临时问答、偶尔的脑暴——Prompt 更快。需要实时外部数据:比如查数据库/拉在线指标/读取第三方系统——优先 MCP。复杂并行、多分支长任务:比如全仓库审计、跨多个系统定位问题——优先 Subagent,再配合 Skill 固化流程。
一句话:
Skill 适合“重复且可标准化”的工作;不适合“偶发且不可复用”的工作。 标准化SOP都没跑通,别跟热风,意义不大。
3)三个最常见误区
误区 A:装得越多越强现实:装多没问题,但触发与命中率会变差,上下文也可能被乱七八糟的描述污染。 正确做法:先装 3 个(样板/导航/标准),跑通闭环再扩展。
误区 B:Skills = Prompt 模板现实:Skill 的价值来自“资产化”:目录、脚本、模板、验收与回滚。 没有验收点、没有输出格式、没有边界说明的 Skill,最后还是“漂”。
误区 C:只看星标不看风险现实:Skill 能执行脚本、能读文件,天然存在安全风险。
所以“能用”之前,它必须“能审计”。
4)结论:Skill 是生产力工具,不是信仰
Skill 的正确心态是:哪里重复、哪里标准化、哪里需要稳定交付,就从那里切一刀。
三、我该怎么用?何时才用?(给你一套可落地的用法,不讲玄学)
一套“10 分钟上手 + 30 分钟改造 + 1 周迭代”的节奏,让你拿去就能执行。
1)什么时候用 Skill:一个最实用的判断公式
你只要问自己三句话:
-
这个任务我是否一周至少做 2 次? -
我是否每次都要强调同一套规则/格式/检查点? -
输出是否存在“看起来完成、其实不可用”的风险(需要验收)?
三个“是”,就值得做成 Skill。 三个里只中一个,先用 Prompt,不要上复杂度。
2)最短闭环:先抄一个能跑通的,再把验收点写进去
别从零写 Skill——先从能跑通的生产级样例开始抄。
把它变成可执行的“两步法”:
第一步:选一个能跑通的 Skill(10–30 分钟)
-
目标不是“写得多漂亮”,是“跑通一次” -
跑通标准:能按说明产出文件/报告/结果,且你能复现
第二步:把你的验收点写进验证步骤(30–60 分钟)很多 Skill “看起来很强、用起来很废”,问题通常不是流程,而是缺验收。 你要做的是把“你心里真正关心的检查点”写进去,比如:
-
输出必须包含:运行方式、关键文件、已知限制 -
自检清单至少 12 条(你第二篇 A/B 里就这么干) -
失败时的回滚策略(尤其是涉及改代码/发 PR/上线)
记住一句话:Skill 的含金量不在“指令多”,在“验收硬”。
3)把“抄来的 Skill”改成自己的:三刀切(超级实用)
第 1 刀:改输入(I/O 契约)把输入从“随便说说”改成固定字段:场景、约束、产物、禁止项。 模型最怕的是不明确的输入。
第 2 刀:改验收(验证步骤)强制输出“自检报告 + 已知限制”。没有这两项,交付一定漂,标准化也就不成立。
第 3 刀:改触发
公式:做什么 + 什么时候用 + 触发关键词。 关键词别怕多,怕的是太少导致命中率低。
4)何时用 MCP、何时用 Skill、何时用 Subagent:
-
需要外部数据/系统操作 → 先 MCP -
有固定流程/规范/输出格式 → 上 Skill -
任务复杂、步骤多、想并行、怕污染上下文 → 用 Subagent -
组合策略:MCP(拿数据)→ Skill(按 SOP 处理)→ Subagent(并行)
四、有哪些可参考的工具和资源
你不缺资源,你缺“最小可用集合”。
1)生产级样板库(先抄作业)
-
Anthropic 官方 skills 仓库(anthropics/skills)价值:结构规范、覆盖面广,有“能跑通”的参考实现(尤其是文档处理类:PDF/DOCX/PPTX/XLSX)。 用法:选一个最贴近你日常的(比如文档处理/报告生成),今天跑通一次。
2)平台规则库(搞清楚机制,避免写成论文)
-
OpenAI Codex Skills 文档价值:解释加载/作用域/调用机制与“渐进式披露”的工程思路,适合做团队规范。 -
Agent Skills 开放标准(agentskills/agentskills & agentskills.io)价值:写一次多处可用,降低平台锁定;对组织级落地很关键。
3)导航与聚合(用来“找”,不是用来“装一堆”)
-
ComposioHQ/awesome-claude-skills(高密度分类导航) 价值:按场景检索,省时间。 注意:它是目录,不是质量保证,具体 Skill 仍要审计与验证。
-
SkillsMP / ClaudeMarketplaces / Claude Code Templates(AITMPL)价值:更像搜索与趋势入口,适合小白快速发现“别人都在用什么”。
4)社区高质量大仓(进阶偷师,但要审计)
-
obra/superpowers价值:偏开发工作流、TDD、调试、评审等“工程型 Skill”,用来搭你自己的工程闭环很合适。 提醒:再口碑好也要审计,尤其是 scripts 和外联行为。
5)治理与上下文工程方向(想把 Agent 做稳的人)
-
上下文工程(Context Engineering)相关仓库(你对比表里提到的那类) 价值:不是教你“装更多”,而是教你“装了也不漂”:诊断、评估、优化上下文策略。 -
技能管理/分发(例如 skillport 这类思路)价值:多机器/多项目同步、统一安装与版本管理,适合团队和重度用户。
6)国内平台动向
-
扣子「技能」与「技能商店」价值:把 Skill 从“开发者工具”推向“普通用户可用的工作流产品”,验证受众规模。 启示:未来会出现大量“非程序员贡献的 Skill”,质量参差更明显,审计与验收会更重要。
你现在立刻该做什么(不焦虑,但要有动作)
-
装 1 个官方 Skill,跑通一次(别挑花眼) -
列出你最重复的 3 类任务(每天/每周都在做的那种) -
先把其中 1 个做成你的第一个 Skill:只要包含输入字段、步骤、输出格式、自检清单,先能用再迭代
提示词不是越长越强,能复用、能审计、能跑通,才叫强。


