LlamaIndex Talk (Data + AI Summit 2024)上关于构建高级RAG(Retrieval-Augmented Generation,检索增强生成)系统的演讲。
演讲标题: Building Advanced RAG Over Complex Documents
演讲内容: 如何构建和改进一个能够处理复杂文档和查询的知识助手,重点在于数据质量的提升和查询复杂性的增加,以及如何通过使用LlamaParse和Agent系统来实现更高级的文档处理和问答功能。
-
PPT概览:
-
构建知识助手。 -
RAG概述:基本RAG及其局限性。 -
提升数据质量:改善大型语言模型(LLM)在复杂数据上的推理能力。 -
使用LlamaParse处理复杂文档。 -
提高查询复杂性:从RAG到Agents。 -
使用LlamaParse驱动的文档Agents。 -
未来展望。 -
企业用例:
-
展示了RAG在企业环境中的一些应用场景,如收件箱管理、知识库、文档处理、工作流自动化和对话代理。 -
知识助手构建:
-
描述了构建一个可以接受任何任务输入并返回输出的界面的目标,包括简单问题、复杂问题和研究任务。 -
RAG简介:
-
介绍了RAG的基本流程,包括数据解析与摄取、数据查询、响应生成等。 -
简单RAG的局限性:
-
讨论了简单RAG方法在原型制作阶段表现良好,但在更复杂数据集和问题上难以产品化的问题。 -
提升数据质量:
-
强调了数据质量的重要性,并讨论了数据解析、分块和索引的一般原则。 -
LlamaParse介绍:
-
介绍了LlamaParse,这是一个专为复杂文档设计的文档解析器,能够提取表格、图表,支持多种文件格式。 -
高级索引与表理解:
-
展示了如何使用LlamaParse和高级索引技术来处理复杂文档,并提供了相关的案例研究和GitHub链接。 -
提高查询复杂性:
-
讨论了复杂问题的例子,以及如何从RAG过渡到更高级的代理系统。 -
从RAG到代理:
-
描述了代理系统的关键组件,包括查询规划、记忆、工具使用等,并讨论了代理的不同级别。 -
工作坊:
-
提供了关于如何使用Databricks LLMs和本地嵌入来构建RAG管道的指导。 -
LlamaCloud:
-
提供了关于在企业环境中构建RAG/代理的联系方式。
ppt原件:



























































推荐阅读
RAG全景图:从RAG启蒙到高级RAG之36技,再到终章Agentic RAG!

