全部标签

RAG技术

关于一个RAG功能需求分析案例——、怎么优化RAG的检索精确度

“ RAG系统中，高质量的文档处理才是RAG系统的核心。” 手上有一个基于自然语言对话的系统，其功能就是根据提供的文档，能通过自然语言对话的方式去询问需要的文档和资料；其本质上来说就是一个RAG系统。在之前一直强调说，RAG开发是一个入门五分钟，但要做好可能要五个月，甚至更久的一项技术；在之前对这句话还没有特别深刻的体会，但经过这个项目算是深有体会了。 RAG功能优化刚开始做这个项目的时候，觉…
RAG技术
- 20
- 0
charles8月1日
踩了无数坑后，我终于搞定了RAG系统的”胡说八道”问题

去年接手公司的智能客服项目时，我以为RAG系统搭建起来就万事大吉了。结果上线第一天就被用户投诉轰炸： "问个信用卡年费，给我说了半天房贷利率？" "明明问的是申请流程，回答得乱七八糟，还缺了好几个步骤！" "这AI是不是在编故事？说什么限时优惠活动，我们银行根本没有！" 经过3个多月的摸爬滚打，总算把这些问题彻底解决了。今天把完整的解决方…
RAG技术
- 16
- 0
charles8月1日
精准与效率：RAG应用PDF文档图文提取OCR策略

在RAG应用中通常需要对各种文档进行文本提取，如果稳定是纯文本那文档提取会简单很多，但通常文档中会存在各种图片信息，这时就需要使用OCR在提取文档文本信息的同时对图片进行OCR获取图片中的文本内容。本文只介绍PDF文档中OCR技术方案。PDF文档解析目前有不少开源框架亦可支持对PDF中的图片进行OCR，但此类框架通常比较重如Marker、Unstructured等。这里只使用PyMuPD…
RAG技术
- 6
- 0
charles7月31日
聊聊Dify如何集成Milvus向量库做RAG

概述在dify集成Milvus向量库，做RAG知识库的存储与检索。 Dify[1]是一个开源平台，旨在通过将 Backend-as-a-Service 与 LLMOps 相结合来简化人工智能应用程序的构建。它支持主流 LLMs，提供直观的提示协调界面、高质量的 RAG 引擎和灵活的 AI Agents 框架。凭借低代码工作流、易用的界面和 API，Dify 使开发人员和非技术用户都能专注于创建创…
RAG技术
- 11
- 0
charles7月31日
RAG + Claude的1TB大文档问答系统实战操作

最近我和一个律师亲戚聊AI时，问了我应该怎么对现在律师事务所庞大的文档做AI检索，从技术上讲用现在的LLM+RAG可以满足需求，但细想不太对劲，因为这里面涉及到很多专业知识，还有律师的专有思维路径，一个不懂律师业务的程序员肯定是做不好的，于是有幸跟他们合伙人进行了深入沟通，合伙人说了一堆但我总结下来就这么一句话 “一个能回答我们所有文档相关问题的工具”。比如：1）描述法庭上发生的事件，2）提…
RAG技术
- 6
- 0
charles7月31日
RAG召回质量翻倍的两个核心技术：我是这样解决”找不准”问题的

最近在优化公司的知识问答系统时，遇到了一个让人头疼的问题：明明知识库里有相关内容，但LLM总是回答"我不知道"或者答非所问。经过深入分析发现，问题出在RAG的召回环节——检索到的文档片段要么不够相关，要么上下文支离破碎。经过一番折腾，我找到了两个特别有效的解决方案：索引扩展和Small-to-Big策略。今天就来分享一下这两个技术的原理和具体实现，希望能帮到有同样困扰的朋友。…
RAG技术
- 5
- 0
charles7月31日
测试不同的RAG技术以找到最佳方案

点击“蓝字” 关注我们检索增强生成（RAG）技术通过结合大型语言模型（LLMs）与外部数据检索能力，能够提供准确且富含上下文的答案。无论是构建客户支持聊天机器人还是研究助手，RAG都能通过从数据库中提取相关信息来增强AI的性能。然而，不同的RAG技术在性能上存在差异，选择最佳技术需要进行测试。本文将全面探讨各类RAG技术，包括基础方法和高级手段，并对它们进行评估，以帮助您根据需求选择最合适的技术。…
RAG技术
- 6
- 0
charles7月31日
Spring AI + Milvus 实现 RAG 智能问答实战

引言 “公司的文档太多，查找信息太慢！”、“客服回答总是千篇一律，不能精准解答用户问题！” —— 这些痛点背后，是传统关键词搜索和规则引擎的局限。如今，语义搜索（Semantic Search）和检索增强生成（Retrieval-Augmented Generation, RAG）正成为解决这些问题的利器。它们能让应用“理解”用户问题的真正意图，并从海量资料中精准找出相关信息，甚至生成自然流…
RAG技术
- 7
- 0
charles7月30日
AI问答系统崩溃？这篇RAG优化实战指南，教你解决90%的检索问题

在人工智能快速发展的今天，RAG（检索增强生成）技术已经成为企业级AI应用的核心组件。然而，很多团队在实际应用中都会遇到一个共同的痛点：用户提问模糊不清，系统检索效果差，最终生成的答案质量堪忧。经过大量实践验证，我总结出了一套完整的RAG知识检索优化方案。今天就来分享这套从查询理解到结果重排的完整技术路径，帮助大家打造高质量的知识问答系统。问题的根源：为什么RAG效果不理想？在深入解决方案之…
RAG技术
- 9
- 0
charles7月30日
基于MCP-RAG的大规模MCP服务精确调用方法

编者荐语Model Context Protocol（MCP）作为连接LLM与现实世界的“万能接口”，其重要性日益凸显。然而，在面对海量用户请求和动态变化的MCP服务集群时，如何高效、精准地获取所需服务，并突破LLM同时管理和调用大量MCP服务的“提示膨胀”瓶颈，成为摆在技术团队面前的一大挑战。本文创新性地提出将检索增强生成（RAG）理念，构建“MCP-RAG”系统，引入MCP服务发现领域，深入探…
RAG技术
- 6
- 0
charles7月30日
优化 AI 问答准确率：知识库实践与避坑指南

上次分享了关于知识库切片方案后，收到了很多朋友的反馈和讨论，甚至还发生了一些小插曲，但大家的关注和认可让我更加坚信这个方案的价值。这次，我将延续上次的内容，深入探讨如何将知识库切片方案优化为问答对模式，以及我们在实际落地 RAG (Retrieval Augmented Generation) 过程中遇到的常见难点和具体的解决方案。希望我的经验能帮助大家少走弯路！一、附件与图片如何存储？告别“污染…
RAG技术
- 6
- 0
charles7月30日
RAG召回优化完全指南：从理论到实践的三大核心策略！

在构建RAG（检索增强生成）系统时，我们经常遇到这样的问题：明明知识库里有相关内容，但检索出来的结果却不够准确。用户问"如何提高深度学习训练效率？"，系统却返回了一堆关于深度学习基础理论的文档，真正有用的优化技巧反而被埋没了。这个问题的根源在于召回环节的不足。召回是RAG系统的第一道关卡，它决定了后续生成的质量上限。今天我们就来深入探讨三个核心的召回优化策略，并提供完整的代码…
RAG技术
- 5
- 0
charles7月30日
RAG 检索四件套全解析：模型、向量库、检索方式、排序器，一文选型不踩坑

想做智能客服、企业知识库、RAG 应用？你绕不开的问题是：该用什么向量模型？用什么库？用什么排序器？本篇一次讲清一、向量模型向量模型是整个语义检索链路的第一步，选错模型，后面再怎么优化都救不回来。 1.什么是向量模型？核心关注点有哪些？一个文本 embedding 模型的核心目标是：把文本映射成一个能表达语义的向量，供向量库做检索、排序或相似度计算。我们选模型时，主要看这几个维度：指标…
RAG技术
- 3
- 0
charles7月30日
从0到1，彻底搞懂 RAG 分块的艺术（附开源代码）

你是否也曾困惑：为什么我的 RAG 系统总答非所问？明明喂给它了完整的文档，为什么还是抓不住重点？答案可能藏在最基础、也最容易被忽视的一环 —— 分块（Chunking）。分块是 RAG 系统的“数据预处理器”，它连接着原始文档和语义检索，是决定模型能否“读懂”资料、并给出精准回答的命脉。今天，我们就来一场深度探索，彻底搞懂 RAG 分块这门艺术。为什么分块如此重要？想象一下，让一个嵌…
RAG技术
- 3
- 0
charles7月30日
大规模RAG实施蓝图

RAG对于大型语言模型应用至关重要，它通过检索相关信息并传递给LLM来提高准确性和减少幻觉。大规模RAG面临扩展挑战，需要关注可搜索单元定义、检索策略选择、排序策略定义以及多个用例的影响，AI搜索平台需支持自动分块、高查询量处理和灵活的索引管道。译自：A Blueprint for Implementing RAG at Scale[1] 作者：Kai Borgen 检索增强生成（RAG）[…
RAG技术
- 4
- 0
charles7月30日
一小时内构建基于Gemma与Bright Data的生产级RAG应用

点击“蓝字” 关注我们在人工智能快速发展的当下，大语言模型（LLM）的应用日益广泛，但模型幻觉、知识时效性差等问题始终困扰着开发者。检索增强生成（RAG）技术的出现为解决这些问题提供了有效方案，它能让模型基于真实数据生成可靠回答。本文将详细介绍如何在一小时内，利用Gemma 3开源模型和Bright Data的SERP API构建一个生产级RAG应用，无需依赖昂贵的商业服务，全程本地运行。一、R…
RAG技术
- 3
- 0
charles7月29日
做RAG系统到底是选MaxKB还是FastGPT

↑↑↑ 点击关注，分享IT技术|职场晋升技巧|AI工具RAG技术是当前阶段做内部知识库或者智能客服的不二之选。然而目前市面上可用作RAG的开源软件实在是太多了，Coze、dify、FastGPT、RAGFlow还有MaxKB，当然还有其它，我就不再一一列举了。今天这篇文章主要探讨在RAG领域，到底是选MaxKB还是FastGPT？核心定位与技术架构对比维度 MaxKB (深度求索) Fast…
RAG技术
- 7
- 0
charles7月28日
企业RAG之构建 FastMCP 服务：基于模型上下文协议的智能服务体系搭建实践

在企业级的RAG系统落地过程中，如何构建一个高效、可扩展、智能化的服务调度体系成为了关键挑战。在本次实践中，我基于 FastMCP 工具，尝试构建一个完整的多服务协作框架，并将其引入企业RAG架构中，探索其在复杂工具链调度、上下文保持、智能决策等方面的能力。为什么选择 FastMCP？FastMCP 是对 MCP 协议的轻量实现，支持标准化的能力注册、健康检查、工具…
RAG技术
- 8
- 0
charles7月28日
RAG数据准备完整实战指南：从原始文档到高质量知识库

在实际项目中，我发现很多RAG系统效果不佳的根本原因并非检索算法或生成模型的问题，而是数据准备阶段的疏忽。经过多个企业级项目的实践，我总结出这套系统性的数据处理方案，能让检索准确率提升40%以上。一、搭建数据评估与分类系统 1.1 敏感信息自动识别实战首先安装必要的依赖包： pip install presidio-analyzer presidio-anonymizer spacypytho…
RAG技术
- 3
- 0
charles7月28日
企业RAG之数据源构建：爬取巨潮资讯网上市企业年报

在构建企业RAG知识库时，数据源通常可分为两类：企业内部知识库：结构明确、数据量中等、可控性强；行业领域专属数据源：数据公开但体量庞大，结构复杂。企业内部数据与行业数据的结合，是构建高质量AI问答系统的核心路径。本篇文章聚焦于企业财报类RAG系统的数据采集阶段，以巨潮资讯网为例，介绍一个稳定、高效的爬虫系统设计方案。一、为什么选择巨潮资讯网？巨潮资讯网是中国证监会指定的信息披露平台，覆盖…
RAG技术
- 22
- 0
charles7月28日
HiRAG：一种基于层级知识索引和检索的高精度RAG

概览论文标题:HiRAG: Retrieval-Augmented Generation with Hierarchical Knowledge 论文链接:https://arxiv.org/pdf/2503.10150.pdf 代码链接:https://github.com/hhy-huang/HiRAG 发表会议:arxiv 一、研究背景现有基于知识图谱(KG)的检索增强生成(RAG)方法…
RAG技术
- 5
- 0
charles7月28日
长文本放提示词中还是采用 RAG？

上周我的 AI 实战营知识星球有一个同学提问：老师，请教下，现在大模型已经支持10多万输入token了，我有个项目提示词有7000来个字，是不是不用RAG也行，效果会比用RAG差？这个问题非常典型，可能也会有很多朋友遇到类似的困惑，我把我的答案分享出来：一、一些常识 1 通常来说，输入越长模型输出越慢，消耗 Tokens 越多，成本就越高 2 虽然很多国外先进模型已经支持 10W tokens…
RAG技术
- 8
- 0
charles7月28日
检索链路全优化：查询重写、重排与压缩如何提升 RAG 效果

关注我们从"答非所问"到"精准回答"：30+架构图解密RAG系统优化的核心秘籍 AI 应用开发，还需要意图识别吗？ Agent 任务分解的完整技术栈（附完整技术方案）" data-itemshowtype="0" linktype="text" data-linktype="2">…
RAG技术
- 4
- 0
charles7月28日
2W8000字揭秘RAG：从基础到高级的逆袭，彻底重塑大模型！

2W8000字揭秘RAG：从基础到高级的逆袭，彻底重塑大模型！ ❝本文2W8000字，配图58张，分了11个小节介绍RAG技术，后续会把最新的方法更新进来~，有些内容是翻译自HuggingFace和一些论文，更多LLM架构文章：LLM架构专栏近日热文：1. 全网最全的神经网络数学原理（代码和公式）直观解释2. 大模型进化史：从Transformer到DeepSeek-R1的AI变革之路3. 2W8…
RAG技术
- 6
- 0
charles7月26日