一个反直觉结论:你越少喂上下文,Agent 反而越能干。
RAG 很努力,但结果不稳定
很多公司做知识库问答(RAG)都是“拼命三郎”:
-
• 文档格式化 -
• 索引调参 -
• 检索融合 -
• 还要给模型加反思链
但最后呢?要么“找不到”,要么“胡编”。
所以我们换个脑回路:不去替模型管上下文,而是给它一个可探索的文件系统。
Agent 只拿一个最小起点,剩下的让它自己找。
换句话说:你负责把食材放进冰箱分门别类,Agent 自己决定做几菜一汤。
一、为什么 Claude Code 宁愿用 grep
先讲清楚背景:代码库动辄上万行,传统做法是“预先索引 + 向量检索”。但 Claude Code 在实践里更像一个“命令行老手”。
它用 glob/grep/find/tail 来定位文件,再逐步精读。
-
• 这样做的好处是:确定性强、可解释、成本低。 -
• 坏处是:没有“看似聪明”的向量索引包装,但结果更稳。
相关原文:
-
• https://mp.weixin.qq.com/s/Fa15GoM3_2CUnjdHQ3I7Nw -
• https://cursor.com/cn/blog/dynamic-context-discovery#
结论很直接:文件系统 + Unix 命令 = 最高效的上下文导航原语。
二、少喂上下文,反而更准
动态上下文发现的核心很简单:
只给 Agent 一个干净的起点,剩下的按需加载。
它解决了三个老问题:
-
• token 不够 -
• 噪音太多 -
• 推理变“走神”
静态 vs 动态上下文
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
再补一个具体场景,很多团队都踩过:
你让 Agent 跑一次数据库迁移,终端输出 5000 行日志,前面 4999 行都是进度条,最后一行才是 ERROR。
-
• 如果你截断输出,关键错误就没了,Agent 只能“猜”。 -
• 如果你把输出写成文件,Agent 先 tail看末尾,再按需定位,就能精准发现问题。
这就是“动态上下文发现”的真实工程价值,而不是一句口号。
三、工具越少越好:d0 的反常识结论
Vercel 的 d0 代理之前工具多到像杂货铺,结果成功率只有 80%。
他们最后删到只剩一个工具:执行任意 bash 命令,反而成功率从 80% 到 100%,步骤更少、token 更少。
原文链接:
https://vercel.com/blog/we-removed-80-percent-of-our-agents-tools
“减法增益”是真的:
每多一个工具,你就替模型做一次选择。
四、Manus 的工程方法:上下文工程不是玄学
Manus 总结了一个非常硬核的生产指标:
KV-cache 命中率是生产阶段 AI 代理最重要的单一指标。
关键实践包括:
-
• 提示前缀稳定 -
• 上下文只追加 -
• 需要时设置缓存断点
还有一个很巧的设计:
遮蔽,而非移除。
动态移除工具会让缓存失效,改用 logits 掩蔽限制可选工具,更稳。
这里再举个“人话版”例子:
Manus 会在复杂任务中创建一个 todo.md,每完成一步就更新。它把目标不断复述到上下文末尾,避免“中间丢失”。
这不是可爱行为,而是注意力管理。
原文链接:
https://manus.im/zh-cn/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus
五、落地方法论:把“上下文”改成“文件”
以下是五个可落地实践:
-
1. 工具输出写文件,先 tail看结论再展开 -
2. 对话历史写文件,摘要只做索引 -
3. Agent Skills 按需加载 -
4. MCP 工具只保留目录,说明书下沉文件夹 -
5. 终端输出写日志,Agent 自己 grep定位错误
Agent Skills 为什么是热点?
因为它本质就是“文件化能力说明”,让模型按需加载技能,而不是你一次性塞满提示词。
你可以把它理解成“技能书书架”:
-
• 系统提示里只放目录 -
• 需要时用关键词或语义搜索找到对应技能 -
• 读到再用
这比把 50 本技能书一次性塞进模型脑子里更现实。
六、什么时候不要全用文件系统
不是所有场景都适合“慢慢找”。
-
• 高时效任务 -
• 强确定性流程 -
• 需要严格 SLA 的系统
这些场景仍需要人为流程和工作流设计。
软件工程没有银弹,选对场景才是银弹。
七、工具选型:Agent Skills 从哪落地
如果你想把 Agent Skills 和文件系统上下文落地,有两个入口:
-
• Claude Agent SDK:内置工具、子代理、权限、会话 -
• Deep Agents:规划、子代理、文件系统工具、长记忆
它们都把“文件化上下文 + 按需发现”做成了开箱即用的能力。
参考链接:
-
• https://platform.claude.com/docs/en/agent-sdk/overview -
• https://docs.langchain.com/oss/python/deepagents/overview
动态上下文发现怎么跑
静态上下文 vs 动态上下文
d0 结果对比
|
|
|
|
|
|---|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
上下文不是喂进去的,是被发现的
真正有效的 Agent,不是“背得多”,而是“找得准”。
文件系统 + Agent Skills,正在把上下文工程从“人肉管理”变成“模型自探索”。
如果你也在做 Agent,建议从“少喂一点”开始。


