全部标签

新闻资讯

RAG关键技术：问题改写（Query Rewriting/Transformation）

前言：问题改写是 RAG 系统中不可或缺的“桥梁”技术，它连接了“用户语言”与“知识库语言”，显著提升了检索的相关性和系统整体性能。掌握并合理应用问题改写方法，是构建高效、智能 RAG 应用的关键一步。1、问题改写（Query Rewriting/Transformation）简介问题改写（Query Rewriting/Transformation）是信息检索、对话系统和RAG（检索增强生成）中…
RAG技术
- 0
- 0
charles4月4日
RAG 已死，上下文工程当立

朋友们好，今天给大家带来最新的 Latent Space 的一期播客的内容，这期内容非常有价值，跟当下最火的概念，上下文工程，息息相关。同时内容里也提到了 RAG，Memory 等这些非常核心的要素。他们采访的对象是 Chroma 的创始人，Jeff Huber, 来分享一些他的观点。原视频地址： https://www.youtube.com/watch?v=pIbIZ_…
RAG技术
- 0
- 0
charles4月4日
小白也能轻松看懂的RAG！！！

1. 引言你刚刚入职，准备在公司大展拳脚，让同事们见识一下新人的能力，于是你主动去问领导有没有什么学习资料，领导非常高兴，给了你一大堆祖传文档让你自己去看。你看了一天才看完一个屎山文档，还剩下一大堆文档等着你去看，你顿时感觉到无从下手，总不能把美好的生命都浪费在看这些屎山文档上吧。这时你忽然想起来，现在不是有大模型嘛，直接问大模型不就好啦，于是你满怀期待的把问题丢给无所不能的大模型，但是得到的回答…
RAG技术
- 0
- 0
charles4月3日
让AI更懂业务：LinkAI对知识库RAG技术的优化实践

RAG（Retrieval-Augmented Generation，检索增强生成）技术经过近两年的快速发展，已经从初期的概念验证阶段进入到了大规模企业级应用的关键时期。在这个过程中，单纯依靠简单的文档切分和基础的向量检索技术已经无法满足企业对于知识库问答质量和AI智能体输出效果的要求。伴随着长期的技术迭代和客户实践，相较于去年介绍的RAG基础优化方案，LinkAI平台对RAG技术和知识库能力的进…
RAG技术
- 0
- 0
charles4月3日
RAG生产环境实战指南：从Demo到百万用户的血泪教训

30万亿人民币的AI蛋糕，为什么你吃不到？你是某大企业的AI负责人，刚刚向CEO展示了一个酷炫的RAG demo。CEO眼睛一亮："太棒了！下个月我们就用AI替换掉一半的客服团队！"你的内心：😱这就是今天我们要聊的故事。一个关于RAG系统如何从"哇，好厉害！"的demo，变成支撑百万用户的生产级系统的血泪史。我们的主人公小王让我给大家介绍今天的主人公——小王…
RAG技术
- 0
- 0
charles4月3日
从召回一堆噪音到提升精准度：我的RAG从Embedding-Only到引入Rerank的实践和思考

写在前面：这篇文章对于很多资深技术人来说，可能有点“小儿科”，但我还是想分享出来。因为它不仅记录了一次技术方案的演进，更重要的是，它是我自己当时最真实的认知成长过程。在项目开发里，我们常说一句话：版本1.0，永远只是个开始。任何一个从“能用”到“好用”的项目，都必然经历一个不断发现问题、解决问题、持续迭代的过程。今天这篇文章，不算是一篇纯粹的技术分享，我更想把它看作是一段刚接触RAG项…
RAG技术
- 0
- 0
charles4月3日
从“数据拼凑”到“精准断案”：深度剖析RAG系统中信息完整性的关键作用

最近在做智能缺陷查重的项目过程中，遇到一个有意思的问题，尽管采用了精心设计的Prompt和强大的LLM，模型在返回重复缺陷时，仍产生数据不一致的“拼凑”结果。通过层层递进的分析，发现问题的根源并非出在Prompt工程或模型本身，而在于RAG数据库中的“信息断层”。这里将问题分析与调试过程记录下来，与大家共享。一、背景：软件工程中“重复缺陷”的治理困境在专有云产品版本演进过程中，重复缺陷的识别与管理…
RAG技术
- 0
- 0
charles4月3日
10分钟搞定！5步让Dify知识库准确率飙升90%，彻底告别AI胡说八道

摘要：朋友们，是不是经常被自己搭建的AI知识库气得血压飙升？用户问：“你们这个产品的保修期是多久？”AI答：“我们的产品质量卓越，享誉全球，终身为您提供优质服务。”（实际保修只有一年）用户问：“请总结一下2023年的财务报告第三季度数据。”AI答：“根据资料，2023年第三季度我们营收...（开始一本正经地编造数据）”疯了！真是疯了！这种“一本正经地胡说八道”，在RAG（检索增强生成）领域我们称之…
RAG技术
- 0
- 0
charles4月3日
别再往AI的知识库塞奇怪的东西了，什么样的知识适合作为RAG知识库？

day16/100不要再往AI的知识库塞奇怪的东西了，什么样的知识适合作为RAG知识库？昨天的文章讨论了知识库构建过程中的一些误区，而其中最重要的一点就是知识库的信息选取。虽然说信息收集和数据清洗最终大多是由程序自动化完成的，但程序筛选的策略决定了最终的知识库到底是金矿还是垃圾场很多时候，搭载了知识库的智能题仍然胡言乱语，问题往往不在于RAG技术的本身，在于错误的粮草——知识库的内容选错了，哪些知…
RAG技术
- 0
- 0
charles4月3日
RAG（检索增强）当主要的问题以及评估方法

RAG（检索增强生成）虽然极大地提升了大型模型（LLM）回答问题的准确性和时效性，但在实际落地过程中，它远非一个完美的解决方案。下面，我们将详细梳理当前 RAG 系统遇到的主要问题，以及业界为解决这些问题而探索出的先进解决实践和涌现出的优秀开源产品。一、当前 RAG 系统面临的核心问题RAG 的问题可以归结为一句话：“垃圾进，垃圾出”（Garbage In, Garbage Out）。这个“垃圾…
RAG技术
- 0
- 0
charles4月3日
告别知识库"大海捞针"！Dify元数据过滤让RAG检索效率翻倍

引言你的dify知识库是不是经常让你感觉像在"大海捞针"？明明上传了几千份文档，但每次查询都要翻遍整个知识库才能找到想要的信息？用户问个简单问题，系统却返回一堆不相关的内容？别担心，这个痛点终于有解了！2025年3月18日，Dify发布了v1.1.0版本，引入了革命性的"元数据过滤"功能。这个功能就像给你的知识库装上了"智能导航系统&q…
RAG技术
- 0
- 0
charles4月3日
RAG成败，始于分块：从“无脑”切分到“智能”切割，一份给工程师的Chunking实战指南

导语你是否也遇到过这样的情况：RAG系统里的LLM明明很强大，Prompt也精心调校过，但最终的问答效果就是不尽如人意？答案时常上下文不全，甚至出现事实性错误。我们排查了检索算法，优化了Embedding模型，却往往忽略了数据进入向量库之前的最关键一步：文档分块。不恰当的分块，就像是给模型提供了一堆被打乱顺序、信息残缺的“坏数据”。模型能力再强，也无法从支离破碎的知识中推理…
RAG技术
- 0
- 0
charles4月3日
一图看懂传统 RAG 与 Agentic RAG 的实战差异

在大型语言模型（LLM）日益普及的今天，检索增强生成（Retrieval-Augmented Generation，RAG）已成为提升 LLM 知识准确性和时效性的关键技术。它通过将 LLM 与外部知识库相结合，有效解决了 LLM 知识滞后和“幻觉”等问题。然而，RAG 技术本身也在不断演进。从最初的传统 RAG 结构，到如今备受关注的 Agentic RAG（智能体式 RAG…
RAG技术
- 0
- 0
charles4月3日
优化 GraphRAG：LightRAG的三大改进

🛠️ 优化 GraphRAG：LightRAG 的三大改进🐼 概要这篇文章是写给已经了解 GraphRAG 基本概念，并希望探讨其在实际应用中如何进行优化的朋友。我们知道 GraphRAG 擅长处理全局性问题，但它的效率、成本和数据更新的灵活性也常常受到关注。本文将从 GraphRAG 的几个核心痛点出发，介绍一种在索引、检索和更新三个方面进行改进的思路，看看如何让它变得更轻量、更快速、也更适应动…
RAG技术
- 0
- 0
charles4月3日
深入解析RAG多轮会话优化：从查询重写到高级策略

一、背景：为何多轮会话是RAG的"必修课"？检索增强生成（Retrieval-Augmented Generation, RAG）技术通过结合外部知识库，极大地提升了大型语言模型（LLM）回答问题的准确性和时效性。一个基础的RAG应用在处理单轮、独立的问答时表现优异。然而，真实世界的交互远不止于此。人类的交流充满了上下文依赖，是自然流畅的多轮对话。用户很自然地会将这种交流习惯带…
RAG技术
- 0
- 0
charles4月3日
基于LLM知识图谱构建高精度RAG

当前， RAG 已经成为业内公认的大模型知识库关键技术路线最佳落地范式之一。RAG 为生成式大模型与外部信息交互提供了良好的解决方案。RAG 通常包括两个阶段：检索上下文相关信息和使用检索到的知识指导生成过程，其基本流程可以分为知识文本准备、文本切分转换、向量数据存储、问题理解及检索、生成问题解答，如下图所示：RAG概念最早由Facebook提出，但受限于当时语言模型的能力，并未引发更多的关注。在…
RAG技术
- 0
- 0
charles4月3日
从图的视角看 RAG：GraphRAG 的工作方式与思考

📄 从图的视角看 RAG：GraphRAG 的工作方式与思考🐼 概要这篇文章是写给对检索增强生成 (Retrieval-Augmented Generation, RAG) 技术感兴趣，并希望了解一些新方法的初学者。我们可能都用过检索增强生成 (RAG)，它在文档里查找具体答案时很方便。但如果我们的问题更大一些，比如“这几百份报告里，主要的争议点是什么？”或者“这个项目的所有访谈记录合起来，反映了…
RAG技术
- 0
- 0
charles4月3日
使用RAG构建高质量知识库（三）- 数据嵌入

书接上文，咱们继续来聊聊数据嵌入和向量化。我们知识库的数据经过清洗和分块后，就需要进行向量化，然后存储在向量数据库中。完整的RAG流程如下：向量长啥样密集向量一般会有64 ~ 1536个维度，维度越多，能表示的精度越高，但相应的存储和计算成本越高。# 原文“AI-Tech实验室”# 密集向量[ 0.11878310581111173, 0.9…
RAG技术
- 0
- 0
charles4月3日
RAG实践技巧：将向量库降级为“语义路由器”，让答案更合理

做教学类工作的同学一定要警惕知识诅咒，因为知者不难、难者不会，比如最近在训练营中我就遇到了类似的问题：学员们真的会对一些概念搞不清楚，初学者对于：Langchain、向量化、RAG 他们是很难分清楚的，我们在做课程设计的时候一定要更加细致一些。所以，我们今天做一篇科普文章，对几个概念进行下简单说明，首先Langchain需要被单拎出来，因为他是一套Agent开发框架，非要去对比也应该是C…
RAG技术
- 0
- 0
charles4月3日
别只顾着卷检索了！真正决定RAG上限的，是这四个“后处理”工程

引言在上一篇文章中告别“搜不到、搜不准”：用这套查询优化，让你的RAG检索召回率飙升，我们探讨了多种提升RAG系统检索阶段性能的策略，包括索引优化、查询转换、混合搜索及QA对生成。这些方法旨在从源头提高信息检索的召回率与准确性。获得了初步的检索结果后，本篇文章将聚焦于后续的关键环节，即如何将这些信息转化为高质量、可靠的最终答案。内容将围绕以下几个核心主题展开：结果精炼: 对初步检索到的文…
RAG技术
- 0
- 0
charles4月3日
RAG 入门指南：LlamaIndex、GraphRAG、 RAGFlow 学习建议与技术选型

本文主要介绍了当前构建基于大语言模型的应用时最主流的 RAG 的核心思想、基本工作流程，RAG 与 LlamaIndex、GraphRAG、 RAGFlow 之间的关系与区别以及RAG学习建议与技术选型。1. RAG 检索增强生成(Retrieval-Augmented Generation)首先， RAG 不是一个工具，而是一种技术范式或架构思想。1.1.…
RAG技术
- 0
- 0
charles4月3日
Spring AI 高级 RAG 优化指南：文档预处理提升检索精度与召回率

在 AI 问答系统中，你是否遇到过这些尴尬场景？用户问 “那个功能咋用”，系统因 query 模糊召回率不足 40%；多轮对话到第 15 轮，上下文 token 直接超限；不同数据源返回的文档重复率超 60%，生成答案满是冗余信息；检索不到结果时，系统要么报错要么 “一本正经地胡说八道”……传统 “单点 RAG”（仅靠一次向量召回）在这些场景中早已力不从心。而Spring AI 框架通…
RAG技术
- 0
- 0
charles4月3日
一文了解Ragflow知识库优化检索的方法

摘要：在我们使用的开源的AI Agent开发工具中，ragflow因为它的知识库相对比较专业，也受到很多开发者的喜欢，目前在github上的星级有62.2K的星。是一个非常受欢迎的开源项目。成为众多开发者和企业处理海量数据、实现高效知识检索与应用的得力助手。但是由于构建知识库的设置不当也会让检索准确性下降很多，本文基于当前的开源情况，深入探讨的优化知识库检索的几个关键参数设置的问题。提升检索召回率…
RAG技术
- 0
- 0
charles4月3日
再看表格RAG 怎么做？及大模型问数开源项目SQLBot实现解析

今天是2025年8月13日，星期三，北京，晴我们继续看RAG方向，这次集中在问数这个场景。讲几个方案，一个是Demo级大模型问数开源项目SQLBot实现解析，看看实现细节。另一个是再看TableRAG的几个思路，看看真多文档中的表格，怎么做RAG，连同之前讲过的，温故而知新。多总结，多归纳，多从底层实现分析，会有收获。一、Demo级大模型问数开源项目SQLBot实现解析大模型问数开源工作，chat…
RAG技术
- 0
- 0
charles4月3日