
2026新年快乐
HAPPY NEW YEAR


-
为什么需要”智能体工程“ -
智能体工程的定义、使命与能力架构 -
智能体工程的10大工程维度 -
结束语:智能体进入”工程时代“
01


-
Demo 往往覆盖的是“常见/干净的输入”;生产环境面对的是开放的行为空间、不可预测的自然语言输入、各种边界/长尾条件 -
概率生成导致“同样输入可能输出不同”;并且 LLM 会尽力“自动补全”,从而带来幻觉
-
企业生产中的上下文更复杂:文档、状态、权限、工具等;如果塞入太多资料,LLM就容易被“带偏”而推理失误
-
没有完善的过滤、版本、会话边界、记忆管理策略,就会出现:引用过期知识/数据、跨用户污染、带入无关历史等
-
Demo 的工具与接口稳定;但企业生产中的实际情况是:API/字段会改名、数据量大会带来超时、会限流、权限会变更等
-
因此如果你的Agent 引擎缺少完善的schema 校验、重试/降级/回滚、熔断等机制,就容易出现“静默式失败”
-
传统系统能靠日志/指标等追踪定位;Agent则需要还原“它为什么这么推理、调用了什么、依据是什么”
-
没有端到端追踪、记录与回放,就无法快速定位与修复;没有“刹车”策略(HITL、阈值等),错误更会被放大
-
缺乏安全意识:Agent的自主行动力可能会越过安全边界 — 越权访问、写入错误、误发消息、得罪客户等 -
Agent被简单的跨部门”滥用“与扩权。没有清晰的能力范围、所有权与复用规范,引发效果不佳与信任危机
02





-
应用交互层:它决定用户如何与 Agent 交互与协作,如何让任务过程可见、关键动作可确认、失败可退场。 -
智能决策层:它是系统中枢,负责任务规划执行,让 Agent 的“感知->思考->行动->输出/交互”成为可控的流程。 -
知识与上下文层:负责把对话历史、企业知识与长期记忆等装配成“恰到好处”的上下文,让推理建立在可靠依据上。 -
运行时与信任层:它提供集成、可观测、安全与治理等能力,确保系统可上线、可观测、可控制、可规模化复制。
03

-
意图澄清与追问策略 -
步骤可视化:让用户知道Agent正在做什么 -
生成式UI:表单/表格/卡片/对比视图等 -
可参与HITL:确认、审核、调整Agent行为 -
失败兜底:转人工、降级、部分结果交付 -
用户反馈闭环:支持用户“赞”或者“抱怨”


-
多模型路由:简单问题用便宜快的,复杂问题用强模型 -
按能力分工:检索/总结/代码/审查/生图考虑不同模型 -
指定私有与公有模型组合策略、是否需要微调 -
提示与对应场景的输出风格对齐 -
模型版本管理与回归评测:避免模型升级引发能力波动


-
规划-执行模式与状态机/工作流编排 -
提升模型确定性的机制、结构化输出等 -
异常处理:重试/降级/回滚/超时 -
并发与异步任务管理 -
长任务的持久化与断点续跑 -
多智能体边界设计与协作编排

-
上下文分层(系统/会话/工具/知识/记忆等)与边界设计 -
重要性与新鲜度排序:减少“无关但占位”的内容 -
必要时的上下文压缩与摘要(但要可追溯、可回放) -
将上下文工程拆分为知识工程、记忆工程等子工程的协同


-
记忆选择:基于价值、频率、稳定性、敏感性来决定是否写入 -
记忆结构:记忆的结构化、压缩及存储选项(文件/向量/图谱) -
检索策略:结合用户、任务相关语义、时间、权限等混合检索 -
生命周期:合并、纠错、删除、过期管理;记忆的冷热区管理 -
隔离与防污染:会话隔离、用户隔离、Agent隔离、权限管理


-
采集与清洗、解析与抽取、归一化 -
元数据体系:部门/版本/生效期/权限/来源可信度 -
索引与检索:索引规划创建、融合检索、重排等 -
生命周期管理:知识变更同步、版本回滚、过期淘汰 -
“可引用”能力:回答能标注依据、可追责可审计


-
通过 MCP 以统一协议访问内部资源与工具/业务API -
通过 A2A 实现Agent服务化、及不同 Agent 间的协作 -
通过 AG-UI/A2UI 集成 Agent 与 已有 UI 应用 -
配套工程:接口兼容策略、限流、故障时的降级等 -
接口变化的容错:版本协商、字段兼容、灰度发布等


-
全链路 Trace:贯穿模型调用、工具调用与状态流转 -
关键指标:token/成本/延迟/工具调用次数/失败率/循环次数等 -
异常检测与报警:卡死、爆 token、工具错误率突增等 -
在线反馈 + 离线回放评测:复盘与回归测试 -
可视化面板与统计报表:支持研发调试与管理决策


-
沙箱环境与执行隔离
-
内容安全护栏、异常检测、熔断与审计日志等
-
身份认证与最小权限(可结合任务阶段动态授权) -
工具的白名单与参数校验 -
提示注入防护(输入隔离、上下文污染检测) -
企业敏感数据脱敏与加密


-
高风险动作策略:放行/降级/升级人工/拒绝(HITL) -
权限与责任绑定:工具/数据权限与岗位、审批链对应 -
证据留存:把决策依据、审批记录、执行轨迹固化为审计证据 -
复用与扩权规范:跨部门复制时明确能力范围、Owner 与指标口径
04


Gartner 曾给出一个预警:到 2027 年底,超过 40% 的 Agentic AI 项目会被取消,核心原因并不是“模型不够强”,而是业务价值不清晰、风险控制不足、成本上升等。 这从另一个角度说明:当你缺少企业级Agent系统的目标能力,再“聪明”的模型和原型也很难造就真正可交付的系统。

对 AI 从业者与开发者而言,未来方向也会更清晰:你需要从“会用模型/写提示词”,到”会设计/验证/开发Agent“,再升级到“会做生产级的Agent系统”。这其中涉及大量的理论、规范、技术与工具 —
后续我们也会围绕这些工程维度,持续更新更细的拆解、工具与平台实践,以及真实落地案例。

