全部标签

RAG技术

语义缓存：提升 RAG 性能的关键策略

检索增强生成（Retrieval-Augmented Generation，简称RAG）（RAG综述：探索检索增强生成技术的多样性与代码实践）技术已经成为构建高性能AI模型的重要基石。RAG通过结合先进的语言模型与外部知识检索，能够生成既准确又富含上下文的响应。然而，尽管RAG功能强大，但它也伴随着一系列挑战，如高令牌消耗（token consumption）、运营成本的增加以及响应时间的延长。这…
RAG技术
- 1
- 0
charles25年4月30日
熬了几个夜，终于让Agentic RAG工作流正常运行了，特来分享一下

一直以来都在想用 LLM + Agent + RAG + FastAPI 搭建一套完整的智能检索增强生成工作流（Agentic RAG Workflow）。我选择了一个客服支持项目来学习，经过一段时间的学习（主要是踩坑），大致上是跑通了这个工作流。赶紧总结分享起来。Agentic RAG（代理型 RAG）只是与 AI 智能体架构一起使用的 RAG（检索增强生成）。使用传统 RAG 和 Agent…
RAG技术
- 3
- 0
charles25年4月30日
[RAG] ChunkRAG: 用于RAG系统的新型LLM分块过滤方法

ChunkRAG的方法论ChunkRAG的方法论旨在通过细粒度的过滤机制来提高检索增强生成（RAG）系统的精确性和事实准确性。该方法论分为两个主要阶段：语义分块和混合检索及高级过滤。语义分块语义分块是ChunkRAG的基础步骤，将输入文档转换为语义上有意义的单元，以促进有效的检索和评估。这一阶段包括以下三个子过程：1. 输入准备：使用NLTK的sent_tokenize函数将文档D分词为句子。每个…
RAG技术
- 6
- 0
charles25年4月30日
15种典型RAG框架：卡内基梅隆大学最新RAG综述

▌1. 引言1.1 检索增强生成（RAG）概览RAG（Retrieval-Augmented Generation）融合了两大核心组件：-（i）检索模块，负责从外部知识库中检索相关文档或信息，利用密集向量表示从大型数据集，如维基百科或私有数据库中识别相关文档。-（ii）生成模块，负责处理这些信息，产出类似人类语言的文本，检索到的文档随后被送至生成模块，该模块通常基于 transformer 架构构…
RAG技术
- 10
- 0
charles25年4月30日
RAG效果不好怎么办？试试这八大解决方案（含代码）

随着自然语言处理（NLP）技术的飞速发展，构建高效的信息检索系统已成为许多企业和开发者的重要需求。LangChain 是一个强大的框架，旨在帮助开发者快速构建和优化基于大型语言模型（LLM）的应用程序。其中检索器是 LangChain 提供的一个核心接口，它可以根据用户的非结构化查询返回相关的文档。每种检索器都有其独特的应用场景和优势，本文将详细介绍 LangChain 中的几种检索器及其应用场景…
RAG技术
- 6
- 0
charles25年4月30日
RAG 架构图解：从基础到高级的7种模式

「RAG 技术通过在 AI 生成过程中引入外部知识检索，从基础的文档查询发展到多模态、Multi-Agent 体协同的智能架构，让 AI 回答更准确、更全面」「核心组件」嵌入模型：将文本转换为向量表示生成模型：负责最终的内容生成重排序模型：优化检索结果的相关性向量数据库：存储和检索向量化的内容提示模板：规范化…
RAG技术
- 5
- 0
charles25年4月30日
什么是相似性搜索？大模型的底座技术

“ 语义分析是人工智能实现的基础，而语义分析实现的基础却是向量 ”说到相似性搜索可能有些人听说过这个词，而有些人可能都没听过这个词；相似性搜索可能很多人都不清楚，但语义搜索应该很多人都听说过；在某种条件下，可以把相似性搜索等价于语义搜索；但相似性搜索又不完全等价于语义搜索。今天，我们就来一起聊一下什么是相似性搜索，这个RAG技术中的大杀器，也是人工智能时代不可或缺的一个技术。‍…
RAG技术
- 7
- 0
charles25年4月30日
揭秘RAG：一文带你轻松区分交叉编码器与双编码器的精髓

在人工智能世界的拼图中，RAG（Retrieval-Augmented Generation）扮演着至关重要的角色。这个名字对我们许多人来说既熟悉又神秘：我们经常听到它，因为它是AI领域的核心组成部分；但同时，我们对它的实际应用和背后的技术细节又知之甚少。别担心，本文将通过直观的图解，带你深入浅出地探索RAG的奥秘，让你不仅认识RAG，还能理解它是如何成为AI世界中不可或缺的力量。让我们一起揭开R…
RAG技术
- 11
- 0
charles25年4月30日
人民大学研究团队发布FlashRAG工具包，为RAG研究提供标准化高效解决方案，赋能研究全流程

今天给大家带来一篇最新的前沿AI论文解读。这篇论文介绍了一个名为FlashRAG的开源工具包，旨在帮助研究人员更有效地进行检索增强生成 (RAG) 研究。FlashRAG由中国人民大学高瓴人工智能学院的研究团队开发，其目标是解决当前RAG研究中缺乏标准化框架、工具包笨重难以定制等问题。什么是RAG？简单来说，RAG是一种将大语言模型 (LLM) 与外部知识库结合的技术。LLM就像一个见多识广的语言…
RAG技术
- 11
- 0
charles25年4月30日
RAG必备武器：Embedding与Rerank的协同召回作战

在信息爆炸的 AI 时代，如何快速而精准地从海量数据中找到最相关的信息，成为了一个关键挑战。传统的关键词匹配方法虽然简单直接，但在面对复杂查询和语义理解时显得力不从心。为了突破这一瓶颈，现代搜索引擎和技术开发者们引入了两种先进的技术：Embedding模型和重排序（Rerank）策略。下面我们将详细探讨这两个技术的概念，以及它们是如何共同作用以提高RAG检索系统性能的。一、了解编码器特性Bi-En…
RAG技术
- 3
- 0
charles25年4月30日
Scaling Test-Time Compute：向量模型上的思维链

自从 OpenAI 发布了 o1 模型后，Scaling Test-Time Compute（扩展推理时计算）就成了 AI 圈子里最火爆的话题之一。简单来说，与其在预训练或后训练阶段疯狂堆算力，不如在推理阶段（也就是大语言模型生成输出的时候）多花点计算资源。o1 模型将一个大问题拆分为一系列小问题（即思维链，Chain-of-Thought），让模型像人一样一步步思考，评估不同的可能性、做更细致的…
RAG技术
- 4
- 0
charles25年4月30日
Alibaba发布：可编辑CoT，超越ReAct20%

本期介绍的是一个Cot思维连框架Verify-and-Edit (VE)。该框架通过根据外部知识对推理链进行后期编辑来提高预测的事实性。Cot思维连的作用思维链 (CoT) 能够改善需要复杂推理的任务的性能，例如数学文字题、常识推理和符号操作。同时，它能够生成可解释的推理链。为什么要编辑CoT思维连提高 CoT 的质量可以有利于提高可解释性和最终任务的性能。人类认为好的解释通常意味着更准确的…
RAG技术
- 4
- 0
charles25年4月30日
使用RAG技术构建企业级文档问答系统：切分(1)Markdown文档切分

1 概述在解析(1)使用MinerU将PDF转换为Markdown中我们提到了将各种文档解析为Markdown的好处，本文我们接着上一篇文章处理后的Markdown，讲解如何对Markdown文档进行切分。在很多文档中，标题都是非常重要的信息，例如企业内部的办理流程，稍微规范点的文档，标题里面都会体现重点信息的。既然转成了Markdown，标题肯定是保留下来了，本文将首先介绍基于Markdown标…
RAG技术
- 7
- 0
charles25年4月30日
模型上下文协议：一个可以让你的AI更聪明的协议

AI是如何“记住”你说过的话的？揭开模型上下文协议的神秘面纱。在与AI交互时，你是否好奇它为什么会记住你的需求，甚至在对话中主动提供个性化建议？这种“记忆力”的背后，依赖于一种叫做模型上下文协议的技术。本篇文章将用浅显的语言解读这项协议的核心逻辑，探讨它如何提升用户体验，同时也分析它的局限性与未来发展方向。从咖啡店点单开始：AI如何理解你想象你在一家智能咖啡店点单。你告诉服务员：“我要…
RAG技术
- 5
- 0
charles25年4月30日
ChatOllama-本地大模型+RAG知识库

本文将介绍用ChatOllama这个项目实现与本地大语言模型的对话并通过这个项目搭建本地知识库进行问答项目地址：https://github.com/sugarforever/chat-ollama现在有很多支持本地运行大预言模型的项目和使用知识库的项目或者平台，之所以想介绍ChatOllama是因为个人使用过后感觉比其他项目好用。特别是它的本地知识库，也就是RAG问答效果，是我到现在用过的几个知…
RAG技术
- 5
- 0
charles25年4月30日
58同城如何通过RAG与Tool Use技术提升AI能力

导读在当前人工智能技术迅猛发展的背景下，智能助手的应用场景愈加广泛，涵盖了从 B 端商家服务到销售培训及大数据分析等多个领域。本文将深入探讨智能助手在 58 同城实际应用中的案例，包括招聘助手和销售陪练的设计与实施，还将分析知识库管理和工具使用对智能助手性能的影响。通过对这些案例的剖析，将揭示如何利用先进的 AI 技术，提升工作效率、优化用户体验，并推动企业数字化转型的进程。主要内容包…
RAG技术
- 4
- 0
charles25年4月29日
GNN-RAG：低成本提升 LLM 效率与效果的革新性 AI 方法

“AI 的最终目的是让机器真正理解世界，而不仅仅是模仿语言。”——这一技术愿景始终推动着自然语言处理的不断创新。然而，即使拥有强大的语言理解能力，LLM（大型语言模型）在面对新兴知识或特定领域内容时，仍显现出适应性不足的问题，导致准确性下降。与此同时，知识图谱（KG）作为信息的结构化载体，以其在知识更新和问答任务中的卓越表现，为解决这些问题提供了突破方向。检索增强生成（RAG）框架通过引入知识图谱…
RAG技术
- 3
- 0
charles25年4月29日
OCR噪声直接命中了RAG的软肋~

在RAG系统中，OCR从非结构化的PDF文档的不完美抽取和结构化数据的非统一表示会导致知识库中出现OCR噪声（语义噪声和格式噪声），最终影响RAG系统的性能。不同级别的语义噪声在纯文本、方程和表格上的示意图，这些都是基于现有的OCR结果进行扰动的。因此提出并开源OHRBench，评估了当前OCR解决方案在现实世界RAG应用中的适用性：基于流水线的OCR表现出最佳性能。在所有OCR解决方案中，使用M…
RAG技术
- 5
- 0
charles25年4月29日
大模型超长窗口上下文与检索增强生成——RAG

“ 怎么解决大模型的记忆问题，以及保证结果的准确性，目前还是大模型应用中一个亟待解决的问题 ”看过作者文章的人对RAG技术应该有了初步的了解，但不知道是否了解大模型的窗口大小；即使没有研究过大模型的窗口，但也应该听过每次大模型输入的内容是有限的；而这个有限就是因为大模型窗口的限制。那么，大模型窗口与检索增强的关系是什么样的？怎么解决长对话问题，随着大模型窗口的增加，RAG会死吗…
RAG技术
- 5
- 0
charles25年4月29日
使用RAG技术构建企业级文档问答系统：解析(1)使用MinerU将PDF转换为Markdown

概述在RAG应用中，一个稍微有点规模的知识库可能包含来自PDF、Word、PPT、网页等各种不同来源的内容，每种内容都有各自的解析器，但想把每种类型的解析都做到比较好是比较繁琐的，直观的例子比如Word中，可能存在页眉、页脚，页面版式可能是左右两栏，PDF中有可能会包含水印等干扰内容，网页就更明显了，这些如果处理不好，都会不同程度地影响后续流程，对每种文档类型分别解析并进行处理的模型，流程如下：为…
RAG技术
- 14
- 0
charles25年4月29日
RAG 数据集准备篇：用三大 Agents 优化评估流程

本文是关于如何优化 RAG 技术的一系列文章之一。在之前的文章中，我们已经深入探讨了如何在 Chunking、Embedding 以及评估指标设计等环节优化 RAG 性能。这篇文章将重点关注如何准备评估 RAG 性能所需的数据集，为后续优化打下坚实基础。1. 优化 RAG 不是“炼丹”，需要系统的方法当涉及到如何优化 RAG（Retrieval-Augmented Generation）性能时，许…
RAG技术
- 5
- 0
charles25年4月29日
打造自己的RAG解析大模型：简单高效的跨页表格合并方案

在构建 RAG 知识库时，PDF文档中的表格跨页现象是一个常见挑战。传统方法依赖复杂的逻辑来判断和合并表格，而更简单、高效的方案可以通过 chunk 的存储和上下文管理来解决。两种表格合并算法两种算法都基于版面识别判断法。前提：正确识别版面并去除每页的页眉、页脚。1. 合并后存储为一个chunk判断当前页最后一个元素和下一页第一个元素的类型：如果两者均为表格类型，则认为是跨页表格的延续。将两页…
RAG技术
- 17
- 0
charles25年4月29日
[RAG] Late Chunking：使用长上下文嵌入模型的上下文化块嵌入

本文介绍一下最近比较火的Late Chunking(延迟分块) ，它用于改进文本嵌入的质量。该方法利用长上下文嵌入模型，在变换器模型之后和均值池化之前进行分块，从而捕获完整的上下文信息。与传统的朴素分块方法相比，延迟分块在各种检索任务中表现更优，且无需额外训练。此外，本文还提出了长延迟分块方法，用于处理超过模型上下文长度的长文档，并介绍了一种基于跨度池化的训练方法，以进一步提高检索准确性。延迟分块…
RAG技术
- 0
- 0
charles25年4月29日
RAG结合知识图谱本周前沿总结：引入推理规则、用于实体链接及KGQA式GraphRAG

今天是2024年11月17日，星期日，北京，天气晴。最近在想，很有趣的是，大家做了那么多，没有一个完美方案，总结的来说：监督微调计算成本高且容易过拟合；上下文学习（ICL）依赖于手工模板，效率低且难以处理长上下文；检索增强生成（RAG）依赖于检索文档的质量和相关性，计算成本高；知识图谱（KG）方法需要大量手动构建和维护，扩展性差。所以，RAG这个补丁越打越多，并且是针对不同的任务再花式地打，所以，…
RAG技术
- 10
- 0
charles25年4月29日