一张图讲清楚：AI Agent工程演进趋势

在前面的文章中，为大家介绍过Agent的发展史" data-itemshowtype="0" target="_blank" linktype="text" data-linktype="2">AI Agent的发展史，以及AI Agent的典型代表：Manus的技术架构" data-itemshowtype="0" target="_blank" linktype="text" data-linktype="2">Manus的技术架构。今天这篇文章，我尝试用通俗易懂的语言，为大家拆解构建AI Agent的技术工程结构以及演进趋势。

1、AI Agent是具备感知环境、做出决策并执行任务能力的AI工具，通过感知、决策和行动实现目标。

AI Agent的核心特点包括：

感知能力：获取外部环境信息，如视觉、听觉。
决策能力：基于信息推理规划，选择行动策略。
行动能力：执行具体任务或操作，影响环境。
学习能力：通过与环境的交互不断改进策略。

简单理解：Agent=大模型 + 插件 + 执行流程，分别对应控制端、感知端和执行端。

2、智能体的古老代表Langchain提出了关于智能体的主要功能特征，主要有五点：

智能体Agent：一个包含AI步骤、能自动完成多步任务的智能程序。
步骤/链条Chain：一个有输入有输出，会进行任务处理的步骤链路。
路由Router：路由规则，决定接下来该执行哪个步骤(基于数值或某些条件)。
工具Tool：基本的工具调用箱，比如日期、搜索、计算等基础功能。
Run概念：context上下文、status状态等可反映Agent运行过程、状态、结果的环境(容器)。

3、基于上述关于Agent的基本概念，我们可以推导出这样一个逻辑：

Agent是执行具体任务的智能程序。
复杂任务需要多个Agent经过WorkFlow才能完成。
多个任务组合就是产品需求，多个需求叠加就形成了一个AI APP。
完成一个符合用户需求的AI APP，需要团队形成工作流程(SOP)，并将其拆解为多个单一任务和多个任务执行流程。

对上述逻辑进行逆向反推，则可以得到这样一个AI Agent的工程迭代演进趋势：

梳理流程：将SOP拆解为多个“单一”任务和多个“任务执行流程”。
任务工具化：将每个任务都自动化，形成一系列小工具，基于高内聚低耦合理念，整合工具能力。
建立任务规划：任务管理调度中心，无论串联还是并联，基于Agent框架自定义或让AI bot规划“任务执行流程”。
不断迭代优化：不断完善和优化“执行任务”的工具，以及“任务执行流程”规划，开发应对具体实际场景的Agents。

最后，我们会得到一个这样的AI Agent工程模型：

一张图讲清楚：AI Agent工程演进趋势

4、对照Manus的技术实现架构，我们就可以在高度抽象后更通俗易懂地理解AI Agent的构建和迭代演进趋势。

一张图讲清楚：AI Agent工程演进趋势

如果喜欢我文章，点赞、关注、在看三连走起。

如果想阅读更多的文章，可以关注我的公众号。

精彩内容推荐

我对AI的几点思考

聊聊突然爆火的Manus

了解AI知识的新手学习路径

我对于AI领域商业模式的思考

一口气讲清楚：AI Agent发展史

一张图讲清楚：Manus的技术架构

MCP、EMB" data-itemshowtype="0" target="_blank" linktype="text" data-linktype="2">一口气讲清楚：LLM、MCP、EMB

一口气讲清楚：AGI、RAG、AIGC

一张图讲清楚AI大模型技术实现逻辑

一口气讲清楚：向量库、训练集、多模态

{{userData.name}}已认证

一张图讲清楚：AI Agent工程演进趋势

更好地使用AI来提升个人能力和效率

警惕 AI 知识库炫技：看着美，用着累