-
大模型:多种RAG组合优化(langchain实现)
大模型RAG优化:Adaptive RAG 这篇文档整合了多种rag优化策略,并且使用langchain实现。可以有效的解决幻觉的问题。概要我们将把RAG论文中的想法整合到RAG代理中:• Routing: Adaptive RAG (paper). 将问题路由到不同的检索方法• Fallback: Corre…- 6
- 0
-
深入使用 Deep Research 后,我确信 RAG 的未来是 Agent
Deep Research 是什么当我们要研究一个话题时,离不开搜索引擎。传统搜索费时费力,新兴AI搜索(如Perplexity)也流于表面、缺乏深度。但是 Deep Research 出现了:它能拆解研究任务,通过搜索、筛选、反思迭代,最终呈现一份条理清晰、内容详实的研究报告。Deep Research 的核心在于其自主思考的智能体(Agent)形态。目前,OpenAI 与 Google Gem…- 8
- 0
-
从传统 RAG 到知识图谱 + Agent,知识库 AI 问答成功率终于达到 95% 了,来自蚂蚁集团的经验
引言本文来源于5月底参加的 #QECon 深圳站上,来自蚂蚁集团的知识库专家关于「领域知识管理和 AI 问答」的分享。介绍了从传统 RAG 到知识图谱再到 Search Agent,一步一步把 RAG 的正确率从 60% 最终提升到 95%。收获非常大,强烈推荐!知识库问答业务场景专家分享的 AI 助手是基于企业内研发知识库,主要目标是降低研发参与咨询工单带来的人力成本消耗,月…- 8
- 0
-
GraphRAG变种这么多,该采用哪种?九大GraphRAG评估参考
系统的评估总是有趣的,在前文,我们通过一个类似的benchmark得出结论:GraphRAG在需要多跳推理和上下文综合的任务中表现优异,但在简单事实检索任务中不如传统RAG。见《什么时候用GraphRAG?RAG VS GraphRAG综合分析》本文,再来看一个评估工作,同样是一个GraphRAG-bench,也再次通过评估得出GraphRAG适合多跳推理场景,并且系统的评估了九大GraphRAG…- 18
- 0
-
知识库太乱找不到资料?5个工具提升你的RAG检索!
这次这篇文章会先简单回顾元数据、标签、知识目录这三种工具。然后,针对读者留言的问题,重点聊聊知识目录、文件目录、知识地图之间的关系,以及什么时候构建,如何构建,如何提升RAG的效果。很干,但很实用。工具1:元数据(系统统一标注标准)元数据是关于数据的数据,主要给管理员用,用来描述文件的客观属性,或设置访问权限。也可以开放一些专用类型给用户进行精确指定问答范围,比如文件名、适用对象等。元数据需要统一…- 8
- 0
-
最新|用Qwen3 Embedding+Milvus,搭建最强企业知识库
前言这几天阿里低调放出两款 Qwen3 家族的新模型:Qwen3-Embedding 和 Qwen3-Reranker(都分别包括0.6B轻量版、4B平衡版、8B高性能版三种尺寸)。两款模型基于 Qwen3 基座训练,天然具备强大的多语言理解能力,支持119种语言,覆盖主流自然语言和编程语言。我简单看了下 Hugging Face 上的数据和评价,有几个点蛮值得分享Qwen3-…- 9
- 0
-
RAG、Agent、MCP:大模型的破局之道
摘要:在当今数字化时代,大模型凭借其强大的语言理解与生成能力,成为了人工智能领域的焦点。无论是智能客服、内容创作,还是数据分析,大模型都展现出了巨大的潜力,为我们的生活和工作带来了诸多便利。但,看似无所不能的大模型,实则也面临着诸多棘手的困境。主要的问题体现在幻觉、缺乏自主性、工具调用难。面对这些困境,难道大模型就束手无策了吗?当然不是!RAG(检索增强生成)、Agent(智能体)、MCP(模型上…- 10
- 0
-
n8n+fastgpt RAG = 王炸!!!用最强AI知识库MCP Server补全 n8n短板
暑假要来了,我的教培业务也要开始进入旺季。小红书、公众号上都要开始做暑假相关的内容但内容生产又成了老大难问题。怎么才能写出不空洞、有垂直业务经验的文章吸引目标客户呢?答案是借助RAG:用行业经验文章形成知识库,每次写文章前都先到知识库搜一下相关内容,再基于这些内容来生产,能最大程度上解决AI幻觉、内容空间等问题。昨天文章也提到,我所有业务工作流都放到了n8n里,但n8n并没有很好的知识库能力。之前…- 11
- 0
-
中文 RAG 系统 Embedding 模型选型技术文档(模版)
文档信息项目内容文档版本v2.0创建日期2025-06-10更新日期2025-06-10适用场景中文检索增强生成(RAG)系统技术领域自然语言处理、信息检索1. 选型背景1.1 业务需求中文RAG系统需要高质量的文本向量化能力,以实现准确的语义检索和知识召回。Embedding模型的选择直接影响:• 检索召回的准确性和相关性• 系统整体的问答质量• 部署成本和推理效率• 后续维护和迭代…- 18
- 0
-
RAG越来越不准?一文详解元数据与标签的系统优化方法(附完整流程图+实用提示词)
你是不是也遇到过这样的场景?公司刚花大钱上线AI知识库,结果AI助手总是“答非所问”,文档明明都上传了,关键时刻还是找不到想要的答案; 苦心搭了一两个月RAG系统,老板随便一问,AI不是遗漏关键信息,就是东拉西扯,感觉还不如直接用大模型; 越用越发现:明明投入了不少时间和成本,RAG效果却越来越让人失望? 其实,你不是一个人。90%的RAG系统体验不理想,核心问题并不…- 9
- 0
-
从 LangChain 到企业级应用:RAG 中 Fixed-Size Chunking 的最佳实践揭秘
众所周知,在构建 RAG(Retrieval-Augmented Generation,检索增强生成)系统的过程中,文档切块策略往往决定了模型检索质量的上限。切得好,信息命中更精准,生成回答更有上下文逻辑;切得差,模型则容易“答非所问”。 在众多策略中,Fixed-Size Chunking(固定切块)可谓最简单直接,却也是最常被忽…- 4
- 0
-
通过源码对 RAGFlow 检索召回机制的分析
1. 引言RAGFlow 是一个基于深度文档理解的开源 RAG(检索增强生成)引擎。接上文:关于 RAGFlow 项目中 RAG 技术的实现分析。本文将基于对 RAGFlow 源代码的分析,详细解析 RAGFlow 在检索召回(Retrieval)环节的实现机制。2. RAGFlow 整体架构根据 GitHub 仓库首页的介绍,RAGFlow 是一个"基于深度文档理解的开源 …- 9
- 0
-
告别 RAG 还太早?听听 Anthropic 怎么说
你有没有向你的RAG系统问过一个具体问题,却得到一个令人沮丧的模糊答案?你并不孤单。以下是一个巧妙的改进方法如何改变游戏规则。想象一下:你为公司的文档建立了一个流畅的RAG(Retrieval Augmented Generation)系统。你问它:“2023年第二季度的收入增长是多少?”它自信地回答:“收入比上一季度增长了3%。”很好,但是……哪家公司?哪个季度?你的系统只是给了你一块拼图,却没…- 7
- 0
-
动态数据太折磨人!静态RAG搞不定,就试下ZEP,让Agent调用实时知识图谱。
您是否遇到过这样的困扰:明明搭建了完善的RAG系统,但Agent总是回答过时的信息,或者面对历史偏好变化时一脸茫然? 三个月前说喜欢激进投资策略,两周前改口要稳健配置,今天又想尝试新兴市场,传统RAG系统只能茫然地检索文档片段,根本无法理解这种动态演进。 这不是您的系统有问题,而是静态RAG天生的局限性在作祟。 传统RAG在动态场景下水土不服 静态文档检索的三大死穴 传统RAG系统本质上是一个…- 4
- 0
-
RAG 还是微调?大模型落地选型指南
点击上方蓝字关注我们越来越多的软件测试人员开始关注如何将 LLM(大语言模型)融入测试工作流。但当我们真正想“动手”时,常常会站在一个岔路口:到底该选择 RAG(检索增强生成)框架,还是直接做微调(fine-tuning)? 这就像是在改造一辆老旧汽车时的两种方式:一种是加装一个超智能导航系统(RAG),依靠外部的地图来快速响应各种路线变化;另一种是更换整个引擎(微调),让它从底层具备更强的自适应…- 5
- 0
-
提升AI问答准确率:请在RAG前先做RAR,超越意图识别
在RAG(检索增强生成)落地的过程中,存在一个效果显著,却常被忽视的技术方法 —— RAR RAR:推理增强检索(Reasoning-Augmented Retrieval) R(检索)与G(生成):谁才是胜负手从搜索引擎到智能助手,从笔记工具到AI知识库,输入框背后几乎都依赖RAG技术。当大模型让“生成”能力在聚光灯下闪耀发光时,我们往往低估了“检索”的决定性作用。尤其在当前大模型能力唾手可得的…- 4
- 0
-
为什么 RAG 一定需要 Rerank?
大家好,我是玄姐。 ▼最近直播超级干,预约保你有收获今天想和大家深入探讨一下检索增强生成(RAG)中的一个重要环节——重排序(Rerank)。RAG 技术一直以来都备受关注,尤其是当它与大模型(LLM)结合后,人们都满怀期待地认为:这下终于可以轻松解决那些复杂的问答任务了!然而,现实往往并不如人意。很多开发者在完成一个 RAG 流程后,都会感到困惑:为什么它的效果并没有达到预期呢?其实,和大多数工…- 8
- 0
-
关于 RAGFlow 项目中 RAG 技术的实现分析
项目概述 RAGFlow 是一个基于深度文档理解的开源 RAG(检索增强生成)引擎。它提供了一个流畅的 RAG 工作流,结合大型语言模型(LLM)提供真实的问答能力,并通过各种复杂格式化数据的引用支持回答。本文通过分析 RAGFlow 的源代码和官方文档,总结其在实现 RAG 技术时采用的最佳实践。 文档处理与切分 深度文档理解(DeepDoc) RAGFlow 的一个核心特色是其深度文档理解…- 10
- 0
-
知识图谱+RAG:大幅提升智能问答系统准确率
在人工智能领域,检索增强生成(RAG)技术已成为解决大语言模型(LLM)知识局限性的主流方案。然而,传统RAG依赖文本块的向量相似性匹配,在处理复杂查询时仍面临诸多挑战。本文将深入探讨知识图谱(KG)如何赋能RAG系统,从理论基础、技术架构到行业实践,全面解析这一技术融合如何实现智能问答准确率的突破性提升。 01 传统RAG的技术瓶颈与知识图谱的引入 检索增强生成(RAG)技术通过结合外部知识库与…- 8
- 0
-
RAGFlow中的Embeddings模型选择及向量数据库选型与实现分析
接前文:关于 RAGFlow 项目中 RAG 技术的实现分析。本文继续基于 RAGFlow 源代码和官方文档,详细分析其 Embeddings 模型选择与配置以及向量数据库选型与实现的技术细节。 1. Embeddings 模型选择与配置 RAGFlow 支持多种 Embeddings 模型,通过rag/llm/embedding_model.py实现了丰富的模型接口和配置选项。 1.1 模型…- 8
- 0
-
“一代更比一代强”:现代 RAG 架构的演进之路
编者按:我们今天为大家带来的文章,作者的观点是:RAG 技术的演进是一个从简单到复杂、从 Naive 到 Agentic 的系统性优化过程,每一次优化都是在试图解决无数企业落地大语言模型应用时出现的痛点问题。 文章首先剖析 Naive RAG 的基础架构及其核心挑战,继而深入探讨三大优化方向:查询动态优化(包括查询重写、查询扩展等策略)、语义理解增强(重点解析 Anthropic 提出的上下文检索…- 6
- 0
-
使用LangGraph构建一个RAG Agent
介绍 这篇文章来介绍下使用 LangGraph 构建 RAG Agent。 RAG通过引入外部知识库,将动态检索与生成能力结合,让LLM既能“博学”又能“可信”。它的核心逻辑是:1️⃣ 检索 → 从知识库中精准拉取相关文档;2️⃣ 增强 → 将检索结果融入提示(Prompt),辅助模型生成;3️⃣ 生成 → 输出兼具准确性与透明度的答案。 1.预处理文档 使用WebBaseLoader工具加载we…- 9
- 0
-
RAG技术全解析:从基础原理到优化实战
你了解RAG吗?,下面这些问题你是否能回答上来呢? 什么是 RAG(RAG 的流程是什么),为什么需要 RAG? 如何对文档分块(Chunking)?分块大小如何选择? 检索时如何计算相似度?余弦相似度有什么缺点? 如何优化 RAG 流程? 什么是 Re-rank?如何重排序? 什么是 GraphRAG? 如何评估 RAG 系统的效果? RAG 有哪些缺点? 本篇文章来详细介绍什么是 RAG?RA…- 4
- 0
-
一文吃透 RAG:7大核心概念,通俗易懂
产品经理求职宝典,王老师携手2位大厂产品负责人编写,点击:《产品经理求职宝典,20 万字,19.9 元》 未来,每个产品经理都是 AI 产品经理,而每个 AI 产品经理都必须懂 RAG。 所谓RAG(Retrieval - Augmented Generation),即信息检索(Retrieval)+内容生成(Generation)。 图片来源:百度 通过 RAG,可以让大模型从指定的内部知识库“…- 4
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页

联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!






















