Claude 宣布:Managed Agents 今天进入公测。

01
你有没有经历过这个
你做了一个 Agent,本地跑得挺好。
然后你开始想上生产……然后,告警开始轰炸了:

客服 Agent 崩了,47 个工单积压。
云函数超时 900 秒。
内存溢出被强杀,熔断器跳闸,重试全部耗尽……
你的 Agent 代码一行都没写错,但你现在整个人都在忙这些。
这不是个别人的遭遇,这是几乎所有人跑 Agent 上生产都会遇到的。
Anthropic 今天说:这些烂活,我来干。
02
几行代码,直接搭好
你告诉 Claude 你想搭什么:

搭一个能评估收购目标的 Agent:研究目标公司、拉财务数据、跑竞争对标分析、起草投资备忘录。
系统会直接给你生成配置 YAML,生成 curl 命令,生成 Session 创建代码。
你要做的,就是改改系统提示词,即可。
03
它帮你接管的

Sandboxing、错误恢复、身份认证、状态持久化、事件管理、文件存储、断点续跑、重试策略……
以前这些随便一条都能卡你几周。
04
然后,Agent 就自己跑了

Session 跑起来之后,你可以看到它在做什么:
扫描数据室的文件结构,打开损益表($421M 营收,EBITDA $59M),读资产负债表(净债务 $124M),搜零售行业对标,拉竞争对手的 EV/EBITDA 倍数……
整个过程,没有人在旁边盯着。
这就是 Managed Agents 的核心:一个长时间自主运行的 Session,全程持久化,断线重连也不丢。
05
系统架构
MCP、Session、Sandbox、Orchestration 四个模块" class="rich_pages wxw-img" data-aistatus="1" data-ratio="1" src="https://api.ibos.cn/v4/weapparticle/accesswximg?aid=137360&url=aHR0cHM6Ly9tbWJpei5xcGljLmNuL21tYml6X3BuZy9aS3FWTGlhSXB6RmtLbHdTU1VCSElqY0VXU0FUVHpOTFo3SjlmczVCWldrY2tCMDNaYXYwbHEyd05EaE1EeG1UTXVUOXZFYVhET3RSR0oxNExDUnpWbkRzMUQ5VVJjUnN4eXFQNTRnYWFxWDQvNjQwP2Zyb209YXBwbXNn" data-w="1080" height="auto" style="max-width:100%;height:auto;display:block;margin:28px auto;">架构的核心是一个 Harness(调度层),连接四个模块:
• Tools + MCP:内置 Bash、文件读写、网页搜索/抓取,以及任意 MCP 服务器接入
• Session:每个 Session 是一个 Agent 实例,历史全量持久化
• Sandbox:云容器,预装 Python、Node.js、Go,支持联网
• Orchestration:多 Agent 协调层,支持拆解任务并行派发
06
几家早期客户的数字
乐天(Rakuten)
五个部门(产品、销售、市场、财务、HR)全部接入,Agent 通过 Slack 和 Teams 接活,交付表格、PPT 和应用程序。
关键数字:
• 上市周期从 24 天缩到 5 天,减少 79%
• 每个专属 Agent 上线不超过一周
• 代码修改准确率 99.9%
• ML 工程师 Kenta Naruse 让 Agent 在 vLLM(1250 万行代码)里独立跑了 7 个小时,数值精度与参考实现完全吻合
7 个小时,1250 万行代码,数值精度全对。
以前谁敢把这个任务直接扔给 AI?
乐天 AI for Business 总经理 Yusuke Kaji:
“ 「有了 Claude Managed Agents,我们的资深用户变得像伽利略一样,能跨越单一专业领域、在多个方向上贡献。每个专属 Agent 在一周内完成部署,在沙箱里跨工程、产品、销售、市场和财务跑长时任务,生成应用、提案 PPT 和表格。随着 Agent 能力越来越强,Managed Agents 让我们能安全地扩展规模,不用自己搭 Agent 基础设施,把精力全放在如何在公司内部普及创新上。」
Vibecode
Vibecode 让用户通过对话在手机上构建和发布 App,不写代码。
他们 CEO 的说法是:以前用户得手动搭 LLM 沙箱、管生命周期、配工具……这个过程动辄要几周或几个月。
现在:
• 开发一个 App 的成本从 $50,000 降到了 $100
• 时间从数月压缩到 1 小时以内
• 基础设施搭建速度 至少快 10 倍
文章开头的「5 万降到 100 元」就是这里来的。
Sentry
Sentry 原本有个叫 Seer 的调试 Agent,能分析 bug 根本原因,但停在那了,修复还是得开发者手动来。
现在接上了后半段:Seer 分析完原因,Claude 写补丁、开 PR,开发者直接收到一个可 review 的修复。
Sentry AI/ML 工程高级总监 Indragie Karunaratne:
“ 「告诉开发者代码哪里出了问题是不够的:他们还想让你帮忙修。现在客户可以从 Seer 的根因分析直接到 Claude 写好修复并开 PR。整个集成从零到上线只用了几周,不用再维护定制化的 Agent 基础设施。」
Notion

数十个任务并行,工程师用它写代码,知识工作者用它生成网页和 PPT,团队一起在输出结果上协作。
Notion 产品经理 Eric Liu:
“ 「我们希望 Notion 成为团队与 Agent 协同办公的最佳场所。Managed Agents 能处理长时 Session、管理记忆、持续输出高质量结果,让这件事成为可能。用户现在可以把开放性的复杂任务,从写代码到生成 PPT 和表格,全部委托出去,不用离开 Notion。」
Asana 用 Managed Agents 构建了 AI Teammates,能在 Asana 项目里和人类并肩接任务、起草交付物。
Atlassian 把 Agent 接进了 Jira,整个集成用了几周。
General Legal 的 Agent 能从用户上传文档里即时生成代码来检索任何未预定义的查询,开发时间缩短 10 倍。
Blockit 的会议前情报助手:自动研究每位参与者,整合日历、联系人、CRM 数据,从想法到上线只用了几天。
07
定价和接入
价格:标准 Claude Platform 的 token 费用,加上每活跃 Session-hour $0.08。
接入需要带上 beta header managed-agents-2026-04-01,官方 SDK 自动处理。
Claude Console 里已经内置了 Session 追踪、分析和排查工具,每一次工具调用、决策过程和报错都看得到。
最新版 Claude Code 里有内置的 claude-api Skill,直接说「start onboarding for managed agents in Claude API」就能上手。
还有三个功能在研究预览阶段,需要单独申请:
• outcomes:定义成功标准,让 Agent 自我评估迭代
• multiagent:多 Agent 协调、并行任务分发
• memory:跨 Session 的持久记忆
同天还上线了 ant CLI,面向 Claude API 的命令行客户端,支持 Claude Code 原生集成,以及用 YAML 管理 API 资源版本。
08
和自己搭有什么不同
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
两者并存,已经有自己 Agent 架构的团队,未必需要迁过来。
但内部测试的数据是:在结构化文件生成任务上,Managed Agents 比普通提示词循环高出最多 10 个百分点的任务成功率,提升最明显的是那些最难的问题。
从 demo 跑通到真正上生产,这段路上倒下的 Agent 项目应该不少。
大部分死在了基础设施上。
这次 Anthropic 想说的是:
这些烂活,交给我

