全部标签

RAG技术

同济大学的Haofen Wang分享的RAG 范式、技术和趋势

RAG 范式、技术和趋势这里分享同济大学 Haofen Wang的关于检索增强生成的报告：《Retrieval-Augmented Generation (RAG): Paradigms, Technologies, and Trends》，RAG 范式、技术和趋势。RAG 概述#为什么会有RAG, 主要是缘于LLM的一些不足：幻觉过时的信息参数化知识效率低缺乏专业领域的深入知识推理能…
RAG技术
- 2
- 0
charles4月28日
关于如何使用Agent进行生成式AI应用开发

1 介绍技术方案交流欢迎关注公众号2 前言由于工作需要，本人在近一年的工作中帮助多个客户实现了基于LLM的AI应用场景落地，也调研实践了目前的很多生成式AI应用开发技术，包括使用RAG、工作流、Agent（含多Agent)协同等各项生成式AI的技术的综合应用，因此本人想对基于Agent进行生成式AI开发做实践总结。3 正文3.1 引言随着人工智能技术的飞速发展，大语言模型（LLM)、检索增强技术（…
RAG技术
- 2
- 0
charles4月28日
AGI专业领域挑战科普，RAFT（检索增强微调）改进这一切

“针对特定领域的问答的微调和RAG方法” 很多人有疑问有了大模型，类似ChatGPT，kimi，为什么还需要受到专业领域限制。不都是知识管理，图文生成么？另外有时候发现大模型答非所问，出现幻觉或者胡编乱造。随着大型语言模型的应用扩展到专业领域，对高效且有效的适应技术的需求变得越来越重要。RAFT（检索增强…
RAG技术
- 1
- 0
charles4月28日
Graph RAG ：智能搜索的未来

随着世界越来越依赖数据，对准确、高效的搜索技术的需求从未如此高涨。传统搜索引擎虽然功能强大，但往往难以满足用户复杂而细微的需求，尤其是在处理长尾查询或专业领域时。Graph RAG 正是在这种情况下应运而生，成为改变游戏规则的解决方案，利用知识图谱和大型语言模型的强大功能来提供智能、上下文感知的搜索结果。 …
RAG技术
- 2
- 0
charles4月28日
高级 RAG 检索策略之内嵌表格

在 RAG（Retrieval Augmented Generation）应用中，最负有挑战性的问题之一是如何处理复杂文档的内容，比如在 PDF 文档中的图片、表格等，因为这些内容不像传统文本那样容易解析和检索。在本文中，我们将介绍几种关于内嵌表格的 RAG 方案，讲解其中解析和检索的技术细节，并通过代码示例让大家更好地理解其中的原理，同时对这些方案进行分析和对比，阐述它们的优缺点。内嵌表格解析与…
RAG技术
- 2
- 0
charles4月28日
LLM+RAG助力企业智能问答工程化实践

编者荐语：LLM（Large Language Model）大语言模型与RAG（Retrieval-Augmented Generation）检索增强生成技术相结合，已成为企业智能问答领域的热门选择。然而，在实际应用中，仍遇到诸多挑战，如：如何将现实中复杂需求分解为当前技术能够回答的问题、如何有序稳定提升智能问答准确率以及如何进行结果评估实现持续优化等。本文旨在深入剖析LLM与RAG在…
RAG技术
- 3
- 0
charles4月28日
大模型的微调和RAG的分别是什么？

摘要：通用大模型存在一定的幻觉问题，通过把企业私有的领域数据知识喂给通用大模型，从而降低了大模型的幻觉，这就是所谓的企业私有大模型，从技术层面来讲，实现企业私有大模型有2个技术手段：微调（Fine-tuning）、RAG（Retrieval Augmented Generation）检索增强生成。Fine-tuning 是什么？‍‍‍‍RAG是什么？‍‍‍‍‍‍‍两者有什么区别？‍‍‍‍‍‍‍‍0…
RAG技术
- 2
- 0
charles4月28日
一文了解AI Agent（智能体）

一、前言AI Agent（人工智能代理）是上半年一个火热的话题。笔者最近对相关概念进行了学习与研究，期间也通过智能体开发平台成功搭建了一些有趣的Agent。所以计划通过本篇文章，跟大家分享笔者对于AI Agent的些许理解。二、AI Agent是什么AI Agent，即人工智能体，是一种能够感知环境、进行自主理解、决策和执行动作的智能实体。简单理解，是一种基于大语言模型，能够通过独立思考、调用工具…
RAG技术
- 2
- 0
charles4月28日
大模型时代，RAG系统在提升信息检索效率和生成文本质量方面展现出了巨大的潜力

大模型时代，RAG系统在提升信息检索效率和生成文本质量方面展现出了巨大的潜力。RAG系统的核心在于与大型语言模型（Large Language Model, LLM）的深度融合。LLM通过大量的预训练数据，具备了强大的语言理解和生成能力。而RAG系统通过引入LLM，使得其在生成准确回答时能够更好地理解上下文和用户意图，从而提供更加智能和人性化的交互体验。今天为大家介绍一个较为成熟的开源RAG系统，…
RAG技术
- 0
- 0
charles4月28日
小而精：llmware如何用小型模型构建企业级RAG管道！

01。概述llmware提供了一个统一框架，用于构建基于大型语言模型（LLM）的应用（例如，RAG，代理），这些应用使用小型、专业化的模型，可以私有部署，安全地与企业知识源集成，并以成本效益的方式为任何业务流程进行调整和适应。llmware有两个主要组成部分：RAG管道 - 集成组件，用于连接知识源到生成性AI模型的全生命周期；以及50多个小型、专业化模型，为关键的企业流程自动化任务进行了微调，包…
RAG技术
- 2
- 0
charles4月28日
【文档智能 & RAG】RAG增强之路-智能文档解析关键技术难点及PDF解析工具PDFlux

前言在私域知识问答和企业知识工程领域，结合Retrieval-Augmented Generation（RAG）模型和大型语言模型（LLM）已成为主流方法。然而，企业中存在着大量的PDF文件，PDF解析的低准确性显著影响了基于专业知识的问答效果，因此，这些文件的有效解析对RAG模型的构建至关重要。上篇文章（【文档智能 & RAG】RAG增强之路：增强PDF解析并结构化技术路线方案及思路）主…
RAG技术
- 4
- 0
charles4月28日
RAG已死？深入解读RAG与超长上下文LLM之争！【上】

现在让我们来聚焦今年以来的一个有趣话题：超长上下文的大模型（Long Context LLM）是否会杀死RAG（检索增强生成）应用？话题回顾自从去年下半年以来，大语言模型的上下文窗口(Context Window)正在以不可思议的速度增长，相比一年之前大模型的上下文窗口还普遍挣扎在4K-8K，现如今超过128K的上下文窗口的大模型比比皆是，从Claude2开始的200K，到Claude3与Gemi…
RAG技术
- 1
- 0
charles4月28日
手把手教你构建Agentic RAG：一种基于多文档RAG应用的AI Agent智能体

PAR01HOT SUMMER什么是Agentic RAG经典RAG应用的范式与架构已经非常流行，你甚至可以在很短的时间内借助成熟框架开发一个简单能用的RAG应用：用户问题被输入RAG、应用执行检索、从被向量化的文档中检索相关知识块、送入到LLM（大语言模型）进行合成响应：但是让我们考虑这样一个应用场景：企业中有大量不同来源与类型的文档（在实际中并不一定代表“文件”，也可以是某种非文件形态的信息，…
RAG技术
- 1
- 0
charles4月28日
HippoRAG：模拟人类记忆的大语言模型

哺乳动物的大脑可以储存大量信息。这对于大型语言模型（LLM）也是可能的，它们可以在其参数中保存大量知识。与LLM不同的是，大脑还能够不断整合新的经验，而不会丧失先前获得的知识。为了部分解决这个问题，已有一些解决方案，例如检索增强生成（RAG）。RAG是一种外部记忆，可以将新信息呈现给模型。尽管LLM在预训练时具有静态和固化的记忆，但得益于RAG，它可以检索到模型训练日期之后的信息。RAG的一个问题…
RAG技术
- 1
- 0
charles4月28日
RAG通识

RAG，即检索增强生成（Retrieval-Augmented Generation），是一种结合了信息检索（Retrieval）和文本生成（Generation）的人工智能技术。RAG是GenAI领域的重大进展，它通过整合外部知识源来增强传统的大语言模型 (LLM)。这种方法拓宽了人工智能的视野，使其能够访问和利用除初始训练数据之外的大量信息。可以将RAG 想象为一位学者，除了拥有自己的知识外，…
RAG技术
- 2
- 0
charles4月28日
DR-RAG：理想汽车最新RAG研究成果，准确率和响应时间远超其他RAG框架

DR-RAG：理想汽车最新RAG研究成果，准确率和响应时间远超其他RAG框架发布时间：2024 年 06 月 11 日RAGDR-RAG: Applying Dynamic Document Relevance to Retrieval-Augmented Generation for Question-AnsweringRetrieval-Augmented Generation (RAG) 显…
RAG技术
- 2
- 0
charles4月28日
一文详谈RAG优化方案与实践

RAG通过检索现有的大量知识，结合强大的生成模型，为复杂的问答、文本摘要和生成任务带来了全新的解决方案。本文详细的介绍了RAG遇到的挑战、通用范式、工程实践、优化实现策略等。一、RAG的背景介绍随着ChatGPT的兴起，大语言模型再次走进人们的视野，其在NLP领域表现出的语言识别、理解以及推理能力令人惊叹。越来越多的行业开始探索大语言模型的应用，比如政务、医疗、交通、导购等行业。通义系列、GPT系…
RAG技术
- 2
- 0
charles4月28日
《构建和评估高级RAG》: RAG评估要素和方法

本文带你了解如下知识：• 评估RAG程序的三要素、• RAG评估的详细流程、• LLM评估的方式有哪些、• 反馈函数的构成和使用RAG评估要素RAG 的评估围绕 RAG 的三要素展开：输入、上下文、输出。形成了三个主要的指标：• 问题相关性、• 上下文相关性、• 事实度（植地性怪怪的，我翻译成事实度，表示结果是否终于…
RAG技术
- 0
- 0
charles4月28日
大模型应用之路：从提示词到通用人工智能（AGI）

大模型在人工智能领域的应用正迅速扩展，从最初的提示词（Prompt）工程到追求通用人工智能（AGI）的宏伟目标，这一旅程充满了挑战与创新。本文将探索大模型在实际应用中的进展，以及它们如何为实现AGI铺平道路。基于AI大模型的推理功能，结合了RAG（检索增强生成）、智能体（Agent）、知识库、向量数据库、知识图谱等先进技术，我们向实现真正的AGI（通用人工智能）迈出了重要步伐。为了方便大家理解，将…
RAG技术
- 1
- 0
charles4月28日
将大型文档拆分为较小的部分是影响检索增强生成 (RAG) 系统性能的一个基本但关键的因素

将大型文档拆分为较小的部分是影响检索增强生成 (RAG) 系统性能的一个基本但关键的因素。用于开发 RAG 系统的框架通常提供多种选项可供选择。在本文中，我想介绍一种新的选项，该选项尝试借助句子嵌入来识别主题的变化，以便在这些点进行细分。这为 RAG 系统的嵌入步骤奠定了基础，可以为编码主题而不是多个主题混合的文本部分找到向量。我们在主题建模的背景下的一篇论文中介绍了这种方法，但它也适用于 RAG…
RAG技术
- 1
- 0
charles4月27日
高级 RAG 检索策略之流程与模块化

我们介绍了很多关于高级 RAG（Retrieval Augmented Generation）的检索策略，每一种策略就像是机器中的零部件，我们可以通过对这些零部件进行不同的组合，来实现不同的 RAG 功能，从而满足不同的需求。今天我们就来介绍高级 RAG 检索中一些常见的 RAG 模块，以及如何通过流程的方式来组合这些模块，实现高级 RAG 检索功能。RAG 模块化模块化 RAG 提出了一种高度可…
RAG技术
- 2
- 0
charles4月27日
实时知识库：如何用 Elasticsearch 实现 RAG

在当前的科技领域，大型语言模型（LLM）如GPT-4已在众多应用场景中表现出色。然而，这些模型仍然存在一些固有的局限性。本文将探讨这些局限性，并介绍如何通过构建检索增强的生成模型（RAG）系统来弥补这些不足。一、LLM的局限性及解决方案LLM 固有的局限性:LLM 的知识不是实时的 LLM 是在特定时间点前的海量数据上训练的，因此它们的知识具有时效性。这意味着在面对最新的事件或快速变化的信息时，L…
RAG技术
- 1
- 0
charles4月27日
1.8K+ Star！RAGapp：一个基于Agentic RAG模型的企业级应用，是企业使用Agentic RAG的最简单方式

项目简介RAGapp[1] 是一个基于 Agentic RAG（Retrieval-Augmented Generation）模型的企业级应用，旨在简化企业使用 Agentic RAG 模型的过程。项目提供了一个简单的 Docker 部署方式，允许用户在自己的云基础设施中部署和配置 RAGapp，项目由 LlamaIndex[2] 构建。使用场景企业内部需要使用先进的 AI 模型来增强业务流程或提…
RAG技术
- 2
- 0
charles4月27日
ChatBI+RAG

数据分析领域如何应用大模型和RAG技术，以及如何实现相关应用的落地。在数据分析领域，应用大模型的方向相当广泛，今天将主要聚焦于对话式BI，这是大家可能最常听说的方向。对话式BI允许非技术人员通过网页端或移动端以自然语言提问。例如，业务人员可以直接在页面上以自然语言提问。提出问题后，我们结合大语言模型和RAG技术进行用户意图的理解，并生成相应的查询语句，这些查询语句可能是SQL形式的，也可能是一些A…
RAG技术
- 0
- 0
charles4月27日