编者按：当前 AI 系统建设中的一大痛点是：盲目追求先进技术而忽视业务实际需求，导致系统过度复杂、成本高昂、可靠性差。许多团队在 Agent 热潮中迷失方向，不知道何时该用简单的 LLM，何时需要 RAG，什么场景下才真正需要智能体。

文章通过简历筛选这一典型应用场景，系统阐述了 AI 系统发展的四个核心阶段：从最基础的纯 LLM 架构，到增强检索能力的 RAG 系统，再到具备工具调用能力的 AI 工作流，最终发展为具有自主决策能力的 AI Agent。作者特别强调，每个架构层级都有其适用场景和技术边界 —— 简单的分类任务可能只需要基础的提示词工程，而复杂的端到端业务流程才需要 Agent 的自主规划能力。我们在追求功能丰富性的同时，必须优先考虑系统的可靠性和稳定性。

作者 | codelink

编译 | 岳扬

AI 系统架构的演进：LLM → RAG → AI Workflow → AI Agent

AI Agent 是当前的一个热门话题，但并非所有 AI 系统都需要采用这种架构。

虽然 Agent 具有自主决策能力，但更简单、更具成本效益的解决方案往往更适合实际业务场景。关键在于根据具体需求选择恰当的架构方案。

本文将探讨大语言模型（LLMs）的最新进展，并解析 AI 系统的核心设计理念。

我们实践过从不包含示例的提示词技术（zero-shot prompting）到思维链推理，从基于 RAG 的架构到复杂工作流及 autonomous agents 等不同复杂度的 LLM 项目。

这个新兴领域的术语体系仍在演进，不同概念之间的边界尚未界定，分类标准仍不固定。随着该领域的发展，新的框架和工程实践不断涌现，推动构建更可靠的 AI 系统。

为直观展示不同系统的差异，我们将通过简历筛选这个典型案例，揭示不同架构层级在能力和系统复杂度上的非线性跃升。

纯 LLM 架构

纯 LLM 本质上是互联网信息的有损压缩包，是从其训练数据中提取的知识快照。它尤其擅长处理依赖其参数化知识（即训练阶段内化的信息）的任务，典型场景包括：总结小说内容、撰写关于全球变暖的论述、用 5 岁儿童能理解的语言解释狭义相对论、或者创作俳句（译者注：日本有一种特定格式的诗歌，叫做“俳（pái）句”，在形式上堪称世界文学中最短的格律诗。）。

但若没有额外的功能扩展，LLM 无法提供实时信息（例如纽约的当前气温）。这正是纯 LLM 与 ChatGPT 等对话式应用的区别 —— 后者通过实时搜索和其他工具增强了核心 LLM 的能力。

不过，并非所有功能增强都需要外部上下文。通过提示词工程（如上下文学习、小样本学习等技术），LLM 无需检索外部信息也能处理特定问题。

应用示例：

只需采用使用单个示例的提示词技术（one-shot prompting）结合上下文学习，就能让 LLM 根据职位描述对简历进行「通过/不通过」的二分类判断。

RAG（检索增强生成）

检索方法通过提供相关上下文来增强 LLM 的能力，使其输出更具时效性、精确性和实用性。借助这一技术，可以让 LLM 访问并处理内部数据。这些上下文信息使 LLM 能够提取信息、生成摘要并生成响应。RAG 还能通过实时数据检索获取最新信息。

应用示例：

在简历筛选场景中，通过检索公司的内部数据（如工程操作手册、招聘政策及历史简历资料）来丰富上下文信息，从而做出更准确的分类判断。

检索过程通常需要借助向量化工具、向量数据库和语义搜索等技术实现。

工具调用（Tool Use）与 AI 工作流（AI Workflow）

LLM 能够通过定义明确的路径实现业务流程自动化，这类系统最适合处理结构清晰、标准统一的任务。

通过使用工具调用（Tool use）可以实现工作流自动化。通过对接各类 API（包括计算器、日历、邮件服务或搜索引擎等），LLM 可以利用可靠的外部工具，而非依赖其存在非确定性的原生能力。

应用示例：

这个 AI 工作流可以连接招聘门户获取简历和职位描述 → 根据经验、学历和技能评估投递简历者的资质 → 发送相应的邮件回复（拒信或面试邀请）。

要实现这个简历筛选工作流，LLM 需要访问数据库、邮件 API 和日历 API，并按照预设步骤以编程方式实现全流程自动化。

AI Agent

AI Agent 是具备自主推理能力和决策能力的系统。它们能够：将任务分解为多个步骤、根据需要调用外部工具、评估执行结果、并自主决定后续动作（存储执行结果/请求人工干预/继续执行下一步）。

这代表着在工具调用和 AI 工作流之上的又一层抽象，实现了规划和决策的自动化。

与 AI 工作流需要明确的用户触发器（如按钮点击）且必须遵循预设路径不同，AI Agent 可以自主启动工作流，并动态决定各环节的执行顺序和组合方式。

应用示例：

AI Agent 可以管理完整的招聘流程，包括：解析简历、通过聊天或邮件协调面试时间、安排面试会议、以及处理日程变更等。

这项综合性任务要求 LLM 具备以下访问权限：数据库、邮件和日历 API，以及聊天和通知系统。

核心要点

1）并非所有系统都需要 AI Agent

应从简单、可组合的模式入手，按需逐步增加复杂度。某些场景仅需检索功能即可满足需求。以简历筛选为例，当筛选标准和后续操作明确时，基础工作流就能胜任。仅当需要更大的自主性以减少人工干预时，才应考虑采用 Agent 方案。

2）注重可靠性而非丰富的功能

LLM 的非确定性特质使得构建可靠系统颇具挑战。虽然快速验证概念（proofs of concept）可行，但将其扩展到生产环境时往往暴露各种问题。建议从沙盒环境起步，实施统一的测试方法，并通过防护机制确保系统可靠性。

END

本期互动内容 🍻

❓您认为 AI Agent 的自主决策权应该设限吗？举例说明边界。（例如：向用户发送拒信是否需要人工复核？）

本文经原作者授权，由 Baihai IDP 编译。如需转载译文，请联系获取授权。

原文链接：

https://www.codelink.io/blog/post/ai-system-development-llm-rag-ai-workflow-agent

AI 及大模型技术分享交流群

干货分享，联系小助手入群

{{userData.name}}已认证

AI 系统架构的演进：LLM → RAG → AI Workflow → AI Agent

纯 LLM 架构

RAG（检索增强生成）

工具调用（Tool Use）与 AI 工作流（AI Workflow）

AI Agent

核心要点

1）并非所有系统都需要 AI Agent

Chonkie：开源、轻量、极速的 RAG 分块神器 🦛

Chonkie：开源、轻量、极速的 RAG 分块神器 🦛