在前面的文章中,为大家介绍过Agent的发展史" data-itemshowtype="0" target="_blank" linktype="text" data-linktype="2">AI Agent的发展史,以及AI Agent的典型代表:Manus的技术架构" data-itemshowtype="0" target="_blank" linktype="text" data-linktype="2">Manus的技术架构。今天这篇文章,我尝试用通俗易懂的语言,为大家拆解构建AI Agent的技术工程结构以及演进趋势。
1、AI Agent是具备感知环境、做出决策并执行任务能力的AI工具,通过感知、决策和行动实现目标。
AI Agent的核心特点包括:
- 感知能力:获取外部环境信息,如视觉、听觉。
- 决策能力:基于信息推理规划,选择行动策略。
- 行动能力:执行具体任务或操作,影响环境。
- 学习能力:通过与环境的交互不断改进策略。
简单理解:Agent=大模型 + 插件 + 执行流程,分别对应控制端、感知端和执行端。
2、智能体的古老代表Langchain提出了关于智能体的主要功能特征,主要有五点:
- 智能体Agent:一个包含AI步骤、能自动完成多步任务的智能程序。
- 步骤/链条Chain:一个有输入有输出,会进行任务处理的步骤链路。
- 路由Router:路由规则,决定接下来该执行哪个步骤(基于数值或某些条件)。
- 工具Tool:基本的工具调用箱,比如日期、搜索、计算等基础功能。
- Run概念:context上下文、status状态等可反映Agent运行过程、状态、结果的环境(容器)。
3、基于上述关于Agent的基本概念,我们可以推导出这样一个逻辑:
- Agent是执行具体任务的智能程序。
- 复杂任务需要多个Agent经过WorkFlow才能完成。
- 多个任务组合就是产品需求,多个需求叠加就形成了一个AI APP。
- 完成一个符合用户需求的AI APP,需要团队形成工作流程(SOP),并将其拆解为多个单一任务和多个任务执行流程。
对上述逻辑进行逆向反推,则可以得到这样一个AI Agent的工程迭代演进趋势:
- 梳理流程:将SOP拆解为多个“单一”任务和多个“任务执行流程”。
- 任务工具化:将每个任务都自动化,形成一系列小工具,基于高内聚低耦合理念,整合工具能力。
- 建立任务规划:任务管理调度中心,无论串联还是并联,基于Agent框架自定义或让AI bot规划“任务执行流程”。
- 不断迭代优化:不断完善和优化“执行任务”的工具,以及“任务执行流程”规划,开发应对具体实际场景的Agents。
最后,我们会得到一个这样的AI Agent工程模型:

4、对照Manus的技术实现架构,我们就可以在高度抽象后更通俗易懂地理解AI Agent的构建和迭代演进趋势。

如果喜欢我文章,点赞、关注、在看三连走起。
如果想阅读更多的文章,可以关注我的公众号。
精彩内容推荐
我对AI的几点思考
聊聊突然爆火的Manus


