-
从传统 RAG 到知识图谱 + Agent,知识库 AI 问答成功率终于达到 95% 了,来自蚂蚁集团的经验
引言 本文来源于5月底参加的 #QECon 深圳站上,来自蚂蚁集团的知识库专家关于「领域知识管理和 AI 问答」的分享。介绍了从传统 RAG 到知识图谱再到 Search Agent,一步一步把 RAG 的正确率从 60% 最终提升到 95%。收获非常大,强烈推荐! 知识库问答业务场景 专家分享的 AI 助手是基于企业内研发知识库,主要目标是降低研发参与咨询工单带来的人力成本消耗,月度工单量数万条…- 4
- 0
-
基于Bad Cases的Dify合同审查案例演示(工作流拆解)
Agent等方法,25年会着重关注有行业Know-how的垂直产业场景应用开发和咨询,欢迎大家交流。" data-id="MzI1ODIxNjk1OQ==" data-is_biz_ban="0" data-service_type="1" data-verify_status="0">4月底时,知识星…- 8
- 0
-
RAG 系统落地的8个常见问题和解决方案
关于什么是 RAG,我有零基础级别科普过,你可以点击这里查看。这篇聚焦落地过程的具体问题及解决方案。一共 8 个常见问题:1. 不按「知识库」的答案回答,自作主张2. 相同的问题不能保证每次回答准确,甚至很多时候是错的3. 回答不完善,而「知识库」中明明有完整答案4. 正确答案和错误答案并存5. 范范回答,没有细节 / 面面俱到,事无巨细6. 回答不显示配图7. 响应非常慢,甚至直接崩…- 6
- 0
-
知识问答的终极形态:突破传统RAG的局限
传统RAG(检索增强生成)技术利用向量知识库,基于大模型的语义理解能力,通过对问题的拆解和向量搜索从知识库筛选内容。但该方法存在明显瓶颈: 1. 召回不完全:关键信息可能遗漏; 2. 召回不精准:返回大量无关内容; 3. 上下文超限:召回内容超出模型处理能力。 这些问题会导致大模型理解偏差,最终输出不精准的答案。 更关键的是,垂直领域的答案往往隐藏在文本深层。我们将答案分…- 4
- 0
-
10 分钟搭建大模型 RAG 智能问答系统
以微信公众号为例,借助阿里大模型平台“百炼”,快速搭建一个智能问答系统,落地于微信服务号对话场景。以及利用 RAG 技术让机器的回答更贴近业务专业知识。建立连接DataNotes在微信公众号与大模型平台之间建立连接,实现微信公众号对话场景中与 RAG 的问答交互。一、打开阿里云「百炼」,创建一个智能体应用 选择大模型版本(版本较多,建议选择版本通义千问-Plus) 配置 Prompt 提示词 …- 4
- 0
-
图解 RAG 的 5 种分块策略
以下是 RAG 的典型工作流程: 由于附加文档可能很大,步骤 1 还涉及分块处理,即将大文档分割成更小/易于管理的小块。 此步骤至关重要,因为它确保文本符合 embedding 模型的输入大小。 以下是 RAG 的五种分块策略: 今天让我们来了解它们! 1.固定大小分块 (Fixed-size chunking) 基于预定义数量的字符、单词或 token 将文本分割成统一的片段。 由于直接分割可能…- 6
- 0
-
RAG(检索增强生成):提升大语言模型性能的终极指南
点击“蓝字” 关注我们一、大语言模型的困境:从“鹦鹉学舌”到“知识饥渴” 在人工智能领域,大语言模型(LLMs)的出现曾让我们惊叹于其语言能力——它们能流畅对话、撰写文章,甚至模仿人类的逻辑推理。然而,随着应用场景的深入,这些“超级智能鹦鹉”的局限性逐渐暴露: 时效性缺失模型训练数据往往截止到某个固定时间点,无法回答“昨晚比赛结果”“最新政策变化”等实时问题。 知识边界模糊面对企业内部文档、专业领…- 6
- 0
-
DO-RAG:一种使用知识图谱增强检索辅助生成的领域特定问答框架 – 清华大学等
摘要领域特定的问答系统不仅需要生成流畅性,还需要基于结构化专家知识的高事实准确性。尽管最近的检索辅助生成(RAG)框架提高了上下文召回率,但它们在整合异构数据和保持推理一致性方面存在困难。为了应对这些挑战,我们提出了DO-RAG,一个可扩展且可定制的混合问答框架,它结合了多级知识图谱构建与语义向量检索。我们的系统采用了一种新颖的代理思维链架构,从非结构化的、多模态文档中提取结构化关系,构建动态知识…- 7
- 0
-
2025年GitHub上十大RAG框架深度解析:从技术原理到实战应用
点击“蓝字” 关注我们一、RAG技术的核心原理与时代价值 大型语言模型(LLMs)的发展正经历着从“通用智能”向“专业智能”的关键跃迁。然而,传统LLMs普遍面临两大瓶颈:一是训练数据的“静态性”导致知识截止问题(如无法获取2023年之后的新信息),二是缺乏外部知识锚点引发的“幻觉”风险(生成不符合事实的内容)。检索增强生成(Retrieval-Augmented Generation,RAG)技…- 11
- 0
-
基于Gemini与Qdrant构建生产级RAG管道:设计指南与代码实践
点击“蓝字” 关注我们一、RAG技术的核心价值与应用场景 在人工智能领域,检索增强生成(Retrieval-Augmented Generation, RAG)正成为解决大语言模型(LLM)知识更新滞后、生成内容不可追溯等问题的关键技术。传统的微调(Fine-Tuning)方法将知识固化在模型参数中,难以应对动态领域的快速变化;而RAG通过将检索与生成解耦,实现了知识的实时更新与可追溯性,尤其适用…- 4
- 0
-
90%企业不知道的RAG优化秘籍:Dify原生集成RAGflow (2)
点击“蓝字” 关注我们 在上一篇我们已经将RAGflow成功进行了部署,文档也成功进行了解析。但是在后面发现dify竟然不能使用了。 AgentLight" data-from="0" data-headimg="https://api.ibos.cn/v4/weapparticle/accesswximg?aid=113173&url=aHR0c…- 10
- 0
-
RAG其实并没有你想的那么简单,Late Chunking vs Contextual Retrieval解决上下文难题
RAG是一种将外部知识库检索与生成模型相结合的技术,不过最近的Agent,MCP喧嚣至上,包括DS-R1模型的热度,让RAG的技术热度下降了很多。甚至我和一些AI的从业者讨论基本技术的时候,大家对RAG嗤之以鼻。其实RAG一点都不简单,我今天就总结了一下RAG的经常遇到的“左右手”怎么选的问题,算是给自己的学习做个总结。 RAG系统通过预先将知识库切分成许多小段并转换成向量,…- 8
- 0
-
RAG和向量数据库之间有什么关系?
RAG 是什么 RAG 即Retrieval-Augmented Generation,检索增强生成,是一种 结合“检索”与“生成”的大语言模型应用架构: Retrieval(检索):从一个文档库中检索与用户问题相关的内容 Augmented Generation(增强生成):将检索到的内容与用户问题一起输入给大语言模型(如 GPT),生成更准确、上下文丰富的回答 向量数据库是干什么的 向量数据库…- 9
- 0
-
RAG相关术语快速了解
RAG (Retrieval-Augmented Generation),检索增强生成 一、RAG架构核心组成 术语 含义 Retriever(检索器) 负责从外部知识库中查找与用户问题相关的文档或片段(如向量数据库中的Top-k检索)。 Generator(生成器) 通常是大型语言模型(如GPT、T5),利用检索到的信息生成最终回答。 Index(索引) 检索系统的核心数据结构,用于快速查找文档…- 6
- 0
-
超越基础:Agentic Chunking 如何彻底改变 RAG?
在检索增强生成(Retrieval-Augmented Generation, RAG)的浪潮中,我们正经历着一场信息检索与大型语言模型(LLM)融合的革命。RAG 系统的核心在于其能够根据外部知识库检索相关信息,并将其作为上下文提供给 LLM,从而生成更准确、更具事实性的回答。而这一过程中,「“分块(Chunking)”」——即将原始文档分割成更小、更易于管理的片段——扮演着至关重要的角色。 然…- 3
- 0
-
基于KG生成语料增强解决RAG问答幻觉问题的简单框架-Walk&Retrieve
Walk&Retrieve基于知识图谱,利用基于图遍历和知识表述来进行零样本RAG的语料库生成。解决RAG系统的幻觉问题。该框架思路比较简单,核心点在于零样本RAG的语料库生成,下面来看看,供参考。 方法架构 语料生成 在框架中,语料生成该方法的核心步骤。该阶段从知识图谱中提取相关信息,并将其转化为适合LLM处理的文本格式。语料生成包括以下几个步骤:基于图的遍历、知识表示和索引。 1.基于…- 3
- 0
-
用Milvus构建RAG系统,N8N VS dify 如何选?
前言如果将大模型视为一个知识丰富但记忆有限的专家,RAG系统则是为其配备了一个能够实时检索和提供准确信息的辅助工具。 而关于如何低门槛搭建一个RAG系统系统,很多朋友可能会纠结究竟选择N8N 还是dify。 如何用Dify+Milvus搭建一个RAG系统,可以参考我们此前发布的教程: Milvus×Dify半小时轻松构建RAG系统 本文,我们则将通过N8N和Milvus这两个实用工具来带大家手把手…- 3
- 0
-
RAGFlow v0.19图文混排:详细拆解+预处理增强案例
Agent等方法,25年会着重关注有行业Know-how的垂直产业场景应用开发和咨询,欢迎大家交流。" data-id="MzI1ODIxNjk1OQ==" data-is_biz_ban="0" data-service_type="1" data-verify_status="0">RAGFlow在…- 7
- 0
-
RAG越来越不准?从Dify和ima知识库看元数据与标签如何让大模型更懂你
你是否有这样的经历:”知识库文档越来越多,知识库问答却越来越不靠谱,RAG检索到的都是一堆不相关的内容。“ 在这个信息爆炸的时代,我们不缺资料,缺的是找到"对的资料"的能力。 元数据和标签看似普通,却能很大提升RAG能力。 这篇文章聊一聊它们如何辅助RAG系统真正理解用户意图,精准找到需要的信息。 元数据(Metadata)简单理解为"描述数据的数据"。 想…- 8
- 0
-
AutoDev 预上下文引擎:预生成代码语义化信息,构建 AI 编程的知识基座
在先前《预上下文生成》的文章中,我们介绍了预生成上下文的概念和实践: 预生成上下文是指在用户发起查询或生成请求之前,系统针对特定代码仓库、文档或 SDK,离线构建一组语义化的上下文数据。这些上下文经过理解、 加工与组织,使其在运行时能够被快速检索和引用,从而提升代码智能体在生成、解释或检索代码时的准确性、相关性和响应速度。 我们在 AutoDev Workbench 中实现了这一概念的分析端与后端…- 6
- 0
-
RAG过时了吗?关键是用对检索方法
RAG 过时了吗?其实,这个说法只是针对简单向量检索在编程场景中的局限性。#RAG 的核心是为 LLM 提供合适的上下文,关键在于选择适合你应用的检索策略。 “RAG 已死”针对的是特定场景,不是全面否定 RAG这里所谓的“RAG 已死”,主要是指在自主编程#智能体(coding Agents)中,单纯依赖向量数据库的检索方式效果有限,并不是说 RAG 整体无用。RAG(#检索增强生成,Retri…- 4
- 0
-
逆天! Claude Opus几小时攻破C++大神4年死磕Bug
reddit上一位网名为“ShelZuuz”的C++大神。这位老哥不是一般人——30多年的C++开发经验,各个大厂都待过(FAANG:脸书、亚马逊、苹果、网飞、谷歌)的Staff Engineer,团队里那种别人搞不定、困扰一周的难题,他站着就能给解决了的“定海神针”式人物但就是这样一位大神,刚刚却被Anthropic的Claude Opus上了一课,甚至直言“今天我被Claude Opus …- 9
- 0
-
用普通人能听懂的话聊聊 RAG
什么是 RAG ? 想象你问学霸一个问题,他先翻书查资料再回答你——这就是RAG(检索增强生成)。这种AI技术让语言模型在回答前先"查资料",结合最新信息给出更靠谱的答案。 一、为什么需要RAG? 传统AI模型像背课本的学生: 知识停留在"课本"出版时(训练数据截止) 遇到不会的问题容易瞎编(产生幻觉) 不懂专业领域知识(比如医疗法律) 回答总是教科书式,不…- 6
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页

联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!
























