-
RAG(检索增强)当主要的问题以及评估方法
RAG(检索增强生成)虽然极大地提升了大型模型(LLM)回答问题的准确性和时效性,但在实际落地过程中,它远非一个完美的解决方案。下面,我们将详细梳理当前 RAG 系统遇到的主要问题,以及业界为解决这些问题而探索出的先进解决实践和涌现出的优秀开源产品。一、 当前 RAG 系统面临的核心问题RAG 的问题可以归结为一句话:“垃圾进,垃圾出”(Garbage In, Garbage Out)。这个“垃圾…- 0
- 0
-
告别知识库"大海捞针"!Dify元数据过滤让RAG检索效率翻倍
引言你的dify知识库是不是经常让你感觉像在"大海捞针"?明明上传了几千份文档,但每次查询都要翻遍整个知识库才能找到想要的信息?用户问个简单问题,系统却返回一堆不相关的内容?别担心,这个痛点终于有解了!2025年3月18日,Dify发布了v1.1.0版本,引入了革命性的"元数据过滤"功能。这个功能就像给你的知识库装上了"智能导航系统&q…- 0
- 0
-
RAG成败,始于分块:从“无脑”切分到“智能”切割,一份给工程师的Chunking实战指南
导语你是否也遇到过这样的情况:RAG系统里的LLM明明很强大,Prompt也精心调校过,但最终的问答效果就是不尽如人意?答案时常上下文不全,甚至出现事实性错误。 我们排查了检索算法,优化了Embedding模型,却往往忽略了数据进入向量库之前的最关键一步:文档分块。 不恰当的分块,就像是给模型提供了一堆被打乱顺序、信息残缺的“坏数据”。模型能力再强,也无法从支离破碎的知识中推理…- 0
- 0
-
一图看懂传统 RAG 与 Agentic RAG 的实战差异
在大型语言模型(LLM)日益普及的今天,检索增强生成(Retrieval-Augmented Generation,RAG)已成为提升 LLM 知识准确性和时效性的关键技术。它通过将 LLM 与外部知识库相结合,有效解决了 LLM 知识滞后和“幻觉”等问题。然而,RAG 技术本身也在不断演进。从最初的传统 RAG 结构,到如今备受关注的 Agentic RAG(智能体式 RAG…- 0
- 0
-
优化 GraphRAG:LightRAG的三大改进
🛠️ 优化 GraphRAG:LightRAG 的三大改进🐼 概要这篇文章是写给已经了解 GraphRAG 基本概念,并希望探讨其在实际应用中如何进行优化的朋友。我们知道 GraphRAG 擅长处理全局性问题,但它的效率、成本和数据更新的灵活性也常常受到关注。本文将从 GraphRAG 的几个核心痛点出发,介绍一种在索引、检索和更新三个方面进行改进的思路,看看如何让它变得更轻量、更快速、也更适应动…- 0
- 0
-
深入解析RAG多轮会话优化:从查询重写到高级策略
一、背景:为何多轮会话是RAG的"必修课"?检索增强生成(Retrieval-Augmented Generation, RAG)技术通过结合外部知识库,极大地提升了大型语言模型(LLM)回答问题的准确性和时效性。一个基础的RAG应用在处理单轮、独立的问答时表现优异。然而,真实世界的交互远不止于此。人类的交流充满了上下文依赖,是自然流畅的多轮对话。用户很自然地会将这种交流习惯带…- 0
- 0
-
基于LLM知识图谱构建高精度RAG
当前, RAG 已经成为业内公认的大模型知识库关键技术路线最佳落地范式之一。RAG 为生成式大模型与外部信息交互提供了良好的解决方案。RAG 通常包括两个阶段:检索上下文相关信息和使用检索到的知识指导生成过程,其基本流程可以分为知识文本准备、文本切分转换、向量数据存储、问题理解及检索、生成问题解答,如下图所示:RAG概念最早由Facebook提出,但受限于当时语言模型的能力,并未引发更多的关注。在…- 0
- 0
-
从图的视角看 RAG:GraphRAG 的工作方式与思考
📄 从图的视角看 RAG:GraphRAG 的工作方式与思考🐼 概要这篇文章是写给对检索增强生成 (Retrieval-Augmented Generation, RAG) 技术感兴趣,并希望了解一些新方法的初学者。我们可能都用过检索增强生成 (RAG),它在文档里查找具体答案时很方便。但如果我们的问题更大一些,比如“这几百份报告里,主要的争议点是什么?”或者“这个项目的所有访谈记录合起来,反映了…- 0
- 0
-
使用RAG构建高质量知识库(三)- 数据嵌入
书接上文,咱们继续来聊聊数据嵌入和向量化。我们知识库的数据经过清洗和分块后,就需要进行向量化,然后存储在向量数据库中。完整的RAG流程如下:向量长啥样密集向量一般会有64 ~ 1536个维度,维度越多,能表示的精度越高,但相应的存储和计算成本越高。# 原文“AI-Tech实验室”# 密集向量[ 0.11878310581111173, 0.9…- 0
- 0
-
RAG实践技巧:将向量库降级为“语义路由器”,让答案更合理
做教学类工作的同学一定要警惕知识诅咒,因为知者不难、难者不会,比如最近在训练营中我就遇到了类似的问题:学员们真的会对一些概念搞不清楚,初学者对于:Langchain、向量化、RAG 他们是很难分清楚的,我们在做课程设计的时候一定要更加细致一些。所以,我们今天做一篇科普文章,对几个概念进行下简单说明,首先Langchain需要被单拎出来,因为他是一套Agent开发框架,非要去对比也应该是C…- 0
- 0
-
别只顾着卷检索了!真正决定RAG上限的,是这四个“后处理”工程
引言在上一篇文章中告别“搜不到、搜不准”:用这套查询优化,让你的RAG检索召回率飙升,我们探讨了多种提升RAG系统检索阶段性能的策略,包括索引优化、查询转换、混合搜索及QA对生成。这些方法旨在从源头提高信息检索的召回率与准确性。获得了初步的检索结果后,本篇文章将聚焦于后续的关键环节,即如何将这些信息转化为高质量、可靠的最终答案。内容将围绕以下几个核心主题展开:结果精炼: 对初步检索到的文…- 0
- 0
-
RAG 入门指南:LlamaIndex、GraphRAG、 RAGFlow 学习建议与技术选型
本文主要介绍了当前构建基于大语言模型的应用时最主流的 RAG 的核心思想、基本工作流程,RAG 与 LlamaIndex、GraphRAG、 RAGFlow 之间的关系与区别以及RAG学习建议与技术选型。1. RAG 检索增强生成(Retrieval-Augmented Generation)首先, RAG 不是一个工具,而是一种技术范式或架构思想。1.1.…- 0
- 0
-
Spring AI 高级 RAG 优化指南:文档预处理提升检索精度与召回率
在 AI 问答系统中,你是否遇到过这些尴尬场景?用户问 “那个功能咋用”,系统因 query 模糊召回率不足 40%;多轮对话到第 15 轮,上下文 token 直接超限;不同数据源返回的文档重复率超 60%,生成答案满是冗余信息;检索不到结果时,系统要么报错要么 “一本正经地胡说八道”……传统 “单点 RAG”(仅靠一次向量召回)在这些场景中早已力不从心。而Spring AI 框架通…- 0
- 0
-
一文了解Ragflow知识库优化检索的方法
摘要:在我们使用的开源的AI Agent开发工具中,ragflow因为它的知识库相对比较专业,也受到很多开发者的喜欢,目前在github上的星级有62.2K的星。是一个非常受欢迎的开源项目。成为众多开发者和企业处理海量数据、实现高效知识检索与应用的得力助手。但是由于构建知识库的设置不当也会让检索准确性下降很多,本文基于当前的开源情况,深入探讨的优化知识库检索的几个关键参数设置的问题。提升检索召回率…- 0
- 0
-
再看表格RAG 怎么做?及大模型问数开源项目SQLBot实现解析
今天是2025年8月13日,星期三,北京,晴我们继续看RAG方向,这次集中在问数这个场景。讲几个方案,一个是Demo级大模型问数开源项目SQLBot实现解析,看看实现细节。另一个是再看TableRAG的几个思路,看看真多文档中的表格,怎么做RAG,连同之前讲过的,温故而知新。多总结,多归纳,多从底层实现分析,会有收获。一、Demo级大模型问数开源项目SQLBot实现解析大模型问数开源工作,chat…- 0
- 0
-
大模型增强检索优化之——用智能体去重构你的RAG系统
“ 不论是RAG,还是智能体都仅仅只是一门技术;而不同的业务场景需要选择合适的技术实现。”最近这段时间一直在做一个RAG检索增强的系统,但由于前期对需求了解不足,导致目前系统开发遇到一些问题,那就是目前使用纯粹的RAG技术很难解决业务需求问题。目前的需求是在一个大的业务场景下有三个子场景,但这个三个场景的入口只有一个对话框,因此需要根据用户的意图来进行识别,然后判断属于哪个子场景。因此,…- 0
- 0
-
大模型RAG实战|基于ThinkDoc文档解析与融合检索能力,提升RAG效果
最近ThinkDoc智能知识库上线了。个人与开发者都可以用。对于个人,作为知识工作者或专业人士,我们可以把 ThinkDoc 作为自己的个人知识库。在上传文档资料之后,我们可以通过智能对话、检索分析和专业写作等智能体直接交互,提升个人的工作效率。对于开发者,我们可以把 ThinkDoc 作为团队或企业的知识库平台。通过 ThinkDoc 丰富的 API 接口,调用强大的文档上传…- 0
- 0
-
当AI学会“查资料”:RAG如何让智能回答更靠谱?
你有没有过这样的经历:问智能助手一个专业问题,它看似自信满满地给出答案,结果细究之下却发现漏洞百出?比如问“2024年诺贝尔物理学奖得主是谁”,它可能搬出2022年的名单;聊一部刚上映的电影,它却描述着十年前的老剧情。这不是AI故意“撒谎”,而是传统大语言模型存在一个致命短板——知识“过时”且“有限”。不过,如今一种叫RAG(检索增强生成)的技术正在改变这一局面。简单说,RAG让AI学会了“查资料…- 0
- 0
-
检索增强生成(RAG):让AI拥有“知识库”能力
RAG(Retrieval-Augmented Generation,检索增强生成)是一种将信息检索与大语言模型生成相结合的技术框架。其核心思想是:在生成回答或文本前,先从外部知识库中动态检索与用户查询相关的信息,再基于检索结果生成更准确、更可靠的答案。简单来说就是,RAG让大模型能像“开卷考试”一样,先查资料再答题。尽管大语言模型已展现出令人瞩目的理解和生成能力,但在实际应用中还面临着幻觉、时效…- 0
- 0
-
从 RAG 到 KAG :结构化思考范式下的复杂推理
导语 |随着人工智能技术的迅速发展,基于大语言模型(LLMs)的应用逐渐成为主流。然而,这些大模型在实际应用中仍像在“闭卷考试”,一旦题目超纲便只能凭空编造,即便后来引入 RAG 让其“开卷”,也常因翻不到正确的页码而答非所问。尤其在垂直领域的应用中,单纯依靠大模型往往无法满足复杂业务对精准问答、实时知识更新和推理深度的需求。因此,技术正从 RAG (Retrieval Augmente…- 0
- 0
-
构建端到端的高级RAG AGENT
在本文中我们将介绍如何使用 LangGraph 实现复杂的 RAG 智能体。该智能体能够重写用户问题、对其进行分类、验证文档相关性,甚至在最终优雅放弃前,还能用优化后的查询进行重试。在我们深入构建高级 RAG 智能体之前,重新审视如何将 RAG 用作 LangGraph 智能体中的工具会很有帮助。介绍传统的 RAG(检索增强生成)系统适用于简单的问题,但难以处理复杂的对话场景。当用户提出…- 0
- 0
-
手搓系列|MAS+RAG实现博客搜索与问答
序最近正好在研究RAG,虽然RAG有很多问题被诟病,但预计未来三年仍然是构建Agent扩展知识库的关键技术,RAG的问题也会逐一被弥补或完善,就像MAS的问题目前最佳解法是构建个性化的Context engineering一样。本文记录构建Agentic RAG系统的过程,结合了LangChain (文档处理), LangGraph (Agent流程控制), Google Gemini (LLM)…- 0
- 0
-
RAG 还能不用 Embedding?OpenAI 给出了新玩法
如果你在用LLM构建应用,你很可能已经和RAG打过交道。RAG 对于用外部数据来增强LLM的能力很棒,但其中的检索——往往很复杂。我自己就曾花上好几个小时纠结:切分块的大小、重叠的策略、该用哪种向量嵌入模型。至于管理向量数据库?那更是一个完整的基础设施挑战。所以,当我在 OpenAI 的 Cookbook 中偶然看到他们关于另一种 RAG 思路的最新研究时——一种号称可以绕过传统嵌入的方案——我的…- 0
- 0
-
基于 pgvector 构建企业级 RAG 系统的实战指南
1. 背景在 AI 驱动的企业知识管理与自动化运维领域,RAG(Retrieval-Augmented Generation) 模式已经成为提升大模型回答准确度和上下文理解能力的关键方案。 传统大模型(LLM)仅依赖训练语料回答问题,而 RAG 在推理前引入 外部知识检索,可显著减少幻觉(Hallucination),提升对领域专属知识的掌握能力。在向量数据库的选择上,pgve…- 0
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页

联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!


















