-
工作流程是通过预定义的代码路径来编排LLMs和工具的系统。
-
另一方面,智能体(Agents)是这样的系统:大型语言模型(LLMs)在其中动态地指导自己的流程和工具使用,保持对如何完成任务的控制。





-
实施防护措施,其中一个模型实例处理用户查询,而另一个模型则筛选其中的不当内容或请求。这种方法通常比让同一个LLM调用同时处理防护措施和核心响应表现更好。
-
自动化评估以评估LLM性能,其中每个LLM调用评估模型在给定提示下性能的不同方面。
-
审查一段代码以查找漏洞,其中多个不同的提示会审查并在发现问题时标记代码。
-
评估给定内容是否不当,通过多个提示评估不同方面或要求不同的投票阈值以平衡误报和漏报。
-
每次对多个文件进行复杂更改的编码产品。
-
搜索涉及从多个来源收集和分析信息以寻找可能相关信息的任务。

-
文学翻译中存在一些细微差别,译者LLM可能最初未能捕捉到,但评估者LLM可以提供有益的批评。
-
需要多轮搜索和分析以收集全面信息的复杂搜索任务,评估者决定是否需要进行进一步搜索。


编码智能体的高级流程