-
关于一个RAG功能需求分析案例——、怎么优化RAG的检索精确度
“ RAG系统中,高质量的文档处理才是RAG系统的核心。” 手上有一个基于自然语言对话的系统,其功能就是根据提供的文档,能通过自然语言对话的方式去询问需要的文档和资料;其本质上来说就是一个RAG系统。 在之前一直强调说,RAG开发是一个入门五分钟,但要做好可能要五个月,甚至更久的一项技术;在之前对这句话还没有特别深刻的体会,但经过这个项目算是深有体会了。 RAG功能优化 刚开始做这个项目的时候,觉…- 20
- 0
-
踩了无数坑后,我终于搞定了RAG系统的”胡说八道”问题
去年接手公司的智能客服项目时,我以为RAG系统搭建起来就万事大吉了。结果上线第一天就被用户投诉轰炸: "问个信用卡年费,给我说了半天房贷利率?" "明明问的是申请流程,回答得乱七八糟,还缺了好几个步骤!" "这AI是不是在编故事?说什么限时优惠活动,我们银行根本没有!" 经过3个多月的摸爬滚打,总算把这些问题彻底解决了。今天把完整的解决方…- 16
- 0
-
精准与效率:RAG应用PDF文档图文提取OCR策略
在RAG应用中通常需要对各种文档进行文本提取,如果稳定是纯文本那文档提取会简单很多,但通常文档中会存在各种图片信息,这时就需要使用OCR在提取文档文本信息的同时对图片进行OCR获取图片中的文本内容。本文只介绍PDF文档中OCR技术方案。PDF文档解析目前有不少开源框架亦可支持对PDF中的图片进行OCR,但此类框架通常比较重如Marker、Unstructured等。 这里只使用PyMuPD…- 6
- 0
-
聊聊Dify如何集成Milvus向量库做RAG
概述 在dify集成Milvus向量库,做RAG知识库的存储与检索。 Dify[1]是一个开源平台,旨在通过将 Backend-as-a-Service 与 LLMOps 相结合来简化人工智能应用程序的构建。它支持主流 LLMs,提供直观的提示协调界面、高质量的 RAG 引擎和灵活的 AI Agents 框架。凭借低代码工作流、易用的界面和 API,Dify 使开发人员和非技术用户都能专注于创建创…- 11
- 0
-
RAG + Claude的1TB大文档问答系统实战操作
最近我和一个律师亲戚聊AI时,问了我应该怎么对现在律师事务所庞大的文档做AI检索,从技术上讲用现在的LLM+RAG可以满足需求,但细想不太对劲,因为这里面涉及到很多专业知识,还有律师的专有思维路径,一个不懂律师业务的程序员肯定是做不好的,于是有幸跟他们合伙人进行了深入沟通,合伙人说了一堆但我总结下来就这么一句话 “一个能回答我们所有文档相关问题的工具”。 比如:1)描述法庭上发生的事件,2)提…- 6
- 0
-
RAG召回质量翻倍的两个核心技术:我是这样解决”找不准”问题的
最近在优化公司的知识问答系统时,遇到了一个让人头疼的问题:明明知识库里有相关内容,但LLM总是回答"我不知道"或者答非所问。经过深入分析发现,问题出在RAG的召回环节——检索到的文档片段要么不够相关,要么上下文支离破碎。 经过一番折腾,我找到了两个特别有效的解决方案:索引扩展和Small-to-Big策略。今天就来分享一下这两个技术的原理和具体实现,希望能帮到有同样困扰的朋友。…- 5
- 0
-
测试不同的RAG技术以找到最佳方案
点击“蓝字” 关注我们检索增强生成(RAG)技术通过结合大型语言模型(LLMs)与外部数据检索能力,能够提供准确且富含上下文的答案。无论是构建客户支持聊天机器人还是研究助手,RAG都能通过从数据库中提取相关信息来增强AI的性能。然而,不同的RAG技术在性能上存在差异,选择最佳技术需要进行测试。本文将全面探讨各类RAG技术,包括基础方法和高级手段,并对它们进行评估,以帮助您根据需求选择最合适的技术。…- 6
- 0
-
Spring AI + Milvus 实现 RAG 智能问答实战
引言 “公司的文档太多,查找信息太慢!”、“客服回答总是千篇一律,不能精准解答用户问题!” —— 这些痛点背后,是传统关键词搜索和规则引擎的局限。如今,语义搜索(Semantic Search) 和 检索增强生成(Retrieval-Augmented Generation, RAG) 正成为解决这些问题的利器。它们能让应用“理解”用户问题的真正意图,并从海量资料中精准找出相关信息,甚至生成自然流…- 7
- 0
-
AI问答系统崩溃?这篇RAG优化实战指南,教你解决90%的检索问题
在人工智能快速发展的今天,RAG(检索增强生成)技术已经成为企业级AI应用的核心组件。然而,很多团队在实际应用中都会遇到一个共同的痛点:用户提问模糊不清,系统检索效果差,最终生成的答案质量堪忧。 经过大量实践验证,我总结出了一套完整的RAG知识检索优化方案。今天就来分享这套从查询理解到结果重排的完整技术路径,帮助大家打造高质量的知识问答系统。 问题的根源:为什么RAG效果不理想? 在深入解决方案之…- 9
- 0
-
基于MCP-RAG的大规模MCP服务精确调用方法
编者荐语Model Context Protocol(MCP)作为连接LLM与现实世界的“万能接口”,其重要性日益凸显。然而,在面对海量用户请求和动态变化的MCP服务集群时,如何高效、精准地获取所需服务,并突破LLM同时管理和调用大量MCP服务的“提示膨胀”瓶颈,成为摆在技术团队面前的一大挑战。本文创新性地提出将检索增强生成(RAG)理念,构建“MCP-RAG”系统,引入MCP服务发现领域,深入探…- 6
- 0
-
优化 AI 问答准确率:知识库实践与避坑指南
上次分享了关于知识库切片方案后,收到了很多朋友的反馈和讨论,甚至还发生了一些小插曲,但大家的关注和认可让我更加坚信这个方案的价值。这次,我将延续上次的内容,深入探讨如何将知识库切片方案优化为问答对模式,以及我们在实际落地 RAG (Retrieval Augmented Generation) 过程中遇到的常见难点和具体的解决方案。希望我的经验能帮助大家少走弯路!一、附件与图片如何存储?告别“污染…- 6
- 0
-
RAG召回优化完全指南:从理论到实践的三大核心策略!
在构建RAG(检索增强生成)系统时,我们经常遇到这样的问题:明明知识库里有相关内容,但检索出来的结果却不够准确。用户问"如何提高深度学习训练效率?",系统却返回了一堆关于深度学习基础理论的文档,真正有用的优化技巧反而被埋没了。 这个问题的根源在于召回环节的不足。召回是RAG系统的第一道关卡,它决定了后续生成的质量上限。今天我们就来深入探讨三个核心的召回优化策略,并提供完整的代码…- 5
- 0
-
RAG 检索四件套全解析:模型、向量库、检索方式、排序器,一文选型不踩坑
想做智能客服、企业知识库、RAG 应用?你绕不开的问题是:该用什么向量模型?用什么库?用什么排序器?本篇一次讲清 一、向量模型 向量模型是整个语义检索链路的第一步,选错模型,后面再怎么优化都救不回来。 1.什么是向量模型?核心关注点有哪些? 一个文本 embedding 模型的核心目标是: 把文本映射成一个能表达语义的向量,供向量库做检索、排序或相似度计算。 我们选模型时,主要看这几个维度: 指标…- 3
- 0
-
从0到1,彻底搞懂 RAG 分块的艺术(附开源代码)
你是否也曾困惑:为什么我的 RAG 系统总答非所问?明明喂给它了完整的文档,为什么还是抓不住重点? 答案可能藏在最基础、也最容易被忽视的一环 —— 分块(Chunking)。 分块是 RAG 系统的“数据预处理器”,它连接着原始文档和语义检索,是决定模型能否“读懂”资料、并给出精准回答的命脉。今天,我们就来一场深度探索,彻底搞懂 RAG 分块这门艺术。 为什么分块如此重要? 想象一下,让一个嵌…- 3
- 0
-
大规模RAG实施蓝图
RAG对于大型语言模型应用至关重要,它通过检索相关信息并传递给LLM来提高准确性和减少幻觉。大规模RAG面临扩展挑战,需要关注可搜索单元定义、检索策略选择、排序策略定义以及多个用例的影响,AI搜索平台需支持自动分块、高查询量处理和灵活的索引管道。 译自:A Blueprint for Implementing RAG at Scale[1] 作者:Kai Borgen 检索增强生成(RAG)[…- 4
- 0
-
一小时内构建基于Gemma与Bright Data的生产级RAG应用
点击“蓝字” 关注我们在人工智能快速发展的当下,大语言模型(LLM)的应用日益广泛,但模型幻觉、知识时效性差等问题始终困扰着开发者。检索增强生成(RAG)技术的出现为解决这些问题提供了有效方案,它能让模型基于真实数据生成可靠回答。本文将详细介绍如何在一小时内,利用Gemma 3开源模型和Bright Data的SERP API构建一个生产级RAG应用,无需依赖昂贵的商业服务,全程本地运行。 一、R…- 3
- 0
-
做RAG系统到底是选MaxKB还是FastGPT
↑↑↑ 点击关注,分享IT技术|职场晋升技巧|AI工具RAG技术是当前阶段做内部知识库或者智能客服的不二之选。然而目前市面上可用作RAG的开源软件实在是太多了,Coze、dify、FastGPT、RAGFlow还有MaxKB,当然还有其它,我就不再一一列举了。 今天这篇文章主要探讨在RAG领域,到底是选MaxKB还是FastGPT? 核心定位与技术架构对比 维度 MaxKB (深度求索) Fast…- 7
- 0
-
企业RAG之构建 FastMCP 服务:基于模型上下文协议的智能服务体系搭建实践
在企业级的RAG系统落地过程中,如何构建一个高效、可扩展、智能化的服务调度体系成为了关键挑战。在本次实践中,我基于 FastMCP 工具,尝试构建一个完整的 多服务协作框架,并将其引入企业RAG架构中,探索其在复杂工具链调度、上下文保持、智能决策等方面的能力。为什么选择 FastMCP?FastMCP 是对 MCP 协议的轻量实现,支持标准化的能力注册、健康检查、工具…- 8
- 0
-
RAG数据准备完整实战指南:从原始文档到高质量知识库
在实际项目中,我发现很多RAG系统效果不佳的根本原因并非检索算法或生成模型的问题,而是数据准备阶段的疏忽。经过多个企业级项目的实践,我总结出这套系统性的数据处理方案,能让检索准确率提升40%以上。 一、搭建数据评估与分类系统 1.1 敏感信息自动识别实战 首先安装必要的依赖包: pip install presidio-analyzer presidio-anonymizer spacypytho…- 3
- 0
-
企业RAG之数据源构建:爬取巨潮资讯网上市企业年报
在构建企业RAG知识库时,数据源通常可分为两类: 企业内部知识库:结构明确、数据量中等、可控性强; 行业领域专属数据源:数据公开但体量庞大,结构复杂。 企业内部数据与行业数据的结合,是构建高质量AI问答系统的核心路径。本篇文章聚焦于企业财报类RAG系统的数据采集阶段,以巨潮资讯网为例,介绍一个稳定、高效的爬虫系统设计方案。 一、为什么选择巨潮资讯网? 巨潮资讯网是中国证监会指定的信息披露平台,覆盖…- 22
- 0
-
HiRAG:一种基于层级知识索引和检索的高精度RAG
概览 论文标题:HiRAG: Retrieval-Augmented Generation with Hierarchical Knowledge 论文链接:https://arxiv.org/pdf/2503.10150.pdf 代码链接:https://github.com/hhy-huang/HiRAG 发表会议:arxiv 一、研究背景 现有基于知识图谱(KG)的检索增强生成(RAG)方法…- 5
- 0
-
长文本放提示词中还是采用 RAG?
上周我的 AI 实战营知识星球有一个同学提问:老师,请教下,现在大模型已经支持10多万输入token了,我有个项目提示词有7000来个字,是不是不用RAG也行,效果会比用RAG差? 这个问题非常典型,可能也会有很多朋友遇到类似的困惑,我把我的答案分享出来: 一、一些常识 1 通常来说,输入越长模型输出越慢,消耗 Tokens 越多,成本就越高 2 虽然很多国外先进模型已经支持 10W tokens…- 8
- 0
-
检索链路全优化:查询重写、重排与压缩如何提升 RAG 效果
关注我们 从"答非所问"到"精准回答":30+架构图解密RAG系统优化的核心秘籍 AI 应用开发,还需要意图识别吗? Agent 任务分解的完整技术栈(附完整技术方案)" data-itemshowtype="0" linktype="text" data-linktype="2">…- 4
- 0
-
2W8000字揭秘RAG:从基础到高级的逆袭,彻底重塑大模型!
2W8000字揭秘RAG:从基础到高级的逆袭,彻底重塑大模型! ❝本文2W8000字,配图58张,分了11个小节介绍RAG技术,后续会把最新的方法更新进来~,有些内容是翻译自HuggingFace和一些论文,更多LLM架构文章:LLM架构专栏近日热文:1. 全网最全的神经网络数学原理(代码和公式)直观解释2. 大模型进化史:从Transformer到DeepSeek-R1的AI变革之路3. 2W8…- 6
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页

联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!




















