-
基于 pgvector 构建企业级 RAG 系统的实战指南
1. 背景在 AI 驱动的企业知识管理与自动化运维领域,RAG(Retrieval-Augmented Generation) 模式已经成为提升大模型回答准确度和上下文理解能力的关键方案。 传统大模型(LLM)仅依赖训练语料回答问题,而 RAG 在推理前引入 外部知识检索,可显著减少幻觉(Hallucination),提升对领域专属知识的掌握能力。在向量数据库的选择上,pgve…- 0
- 0
-
使用RAG构建高质量知识库(二)- 数据分块
上一篇文章我们介绍了RAG的基本概念和原理, 感兴趣的同学也可以回去补补课。使用RAG构建高质量知识库(一)今天咱们就继续来聊聊知识库的数据清洗与分块策略。为啥要分块为了精准召回知识库的内容!事实上,如果我们不做分块,直接把整个知识库丢给大模型,让他参照执行,在知识内容较少的情况下,是完全可行的。但在真实使用场景,往往知识库都非常复杂,比如在AI医疗场景,知识库会收录上万本权威医疗指南,每个指南都…- 0
- 0
-
使用RAG构建高质量知识库 (一)
在AI应用领域,各种新技术新名词层出不穷,但最实用的技术莫过于RAG了。相信稍微接触过AI的同学都不会陌生,但要想用好RAG,还是有一定门槛。今天咱们就来聊一聊RAG。RAG是什么?检索增强生成Retrieval-Augmented Generation一般用户在使用大模型的时候,其实只需要使用自然语言问问题,大模型就会返回相应的答案。所以只要掌握好提示词工程,大多数场景就已经可以让大模型乖乖给你…- 0
- 0
-
RAG vs 微调:AI测试知识库构建的两种路线之争
你是不是也被这种"AI智商税"折腾过?花了半个月搭建AI测试助手,喂了几千条历史用例,结果AI生成的测试用例要么是去年的旧需求,要么就是完全不存在的功能。你怀疑人生:明明训练了这么多数据,为什么AI还是一问三不知?或者,你尝试了RAG(检索增强生成),把所有文档塞进向量数据库,结果AI回答问题时,要么检索不到相关内容,要么检索到一堆八竿子打不着的历史文档,最后拼出来…- 0
- 0
-
RAGFlow 实践:SQL Assistant 工作流搭建
工作流简介 本教程通过搭建一个 SQL Assistant 工作流,实现自然语言查询 SQL 数据库的功能。企业内的市场运营、产品经理等非技术背景人员可以使用此助手独立查询企业的业务数据,减少对数据分析师的依赖;学校和编程教育机构也可以使用它作为 SQL 的教学工具。该工作流编排完成后,如下:工作流编排思路:将数据库的 Schema、数据库表的每个字段…- 0
- 0
-
RAG中召回率和召回准确度的区别和联系
“ RAG的优化方向只有两个,召回率和准确率也就是精度。”在前面的文档中简单介绍过RAG的几种优化方式,因为从本质上来说RAG的目的只有一个,那就是快速并且准确的召回数据。但在实际的RAG系统中,我们往往会面临着一个问题,那就是召回率和准确率的问题;如果RAG系统的召回率太低,那么RAG就没有了存在的意义。以作者目前遇到的实际问题为例,就是数据召回率不足,更不用说召回的准确率了,也就是精…- 0
- 0
-
使用 Milvus 快速搭建 RAG 服务
使用 Milvus 快速搭建 RAG 服务总结一下我使用 Milvus 做 RAG 时踩过的坑,如果你在正在给老师做项目,然后项目里又要求有知识检索(RAG)的功能,然后又愁不知道怎么做,可以看看我的总结。一、云端 or 本地Milvus提供了本地部署的方式,也就是用 docker 去部署一个 Milvus 数据库,然后把你的数据存进去就可以实现检索。但是用 docker 部署太重了,你需要写很多…- 0
- 0
-
你每天用的AI,可能被“投毒”了!
如今,人工智能(AI)技术飞速发展,我们在享受便捷的同时,也可能会遭遇“AI幻觉”,即AI生成一些看似合理但实际上错误、虚构的信息。更严重的是,AI还可能会因为被“投毒”而出错。当AI能写诗、作画,甚至替你处理工作邮件时,你是否想过,它也可能被恶意投喂“毒数据”,沦为一场技术暗战的牺牲品?“毒数据”,具体是指与色情、赌博、欺诈相关的有害信息,以及错误、虚假信息等。那么,AI是怎么被“投毒”的呢?我…- 0
- 0
-
大模型私有化部署安全防护策略(下)
本期将为您介绍大模型检索增强生成(RAG)应用的相关安全防护策略(完整思维导图如下)。(可点击查看大图并保存)大语言模型普遍存在“幻觉”问题,当用户问题涉及未被明确训练过的内容时,模型可能会产生不真实、错误或虚构的信息。而通过模型训练和微调解决幻觉问题的方法容易受到垂直领域知识更新快、迭代迅速的影响,存在成本高、效率低的问题。因此,RAG凭借即插即用、检索技术成熟的优势,成为了大模型在垂直领域落地…- 0
- 0
-
打造企业专属知识大脑!用Dify构建RAG智能能问答系统,让知识检索像聊天一样简单
引言公司有成千上万份技术文档、培训资料,员工找个信息要翻半天?传统搜索只能找到文件名,找不到答案?今天教你用dify打造一个企业专属的"知识大脑"!基于RAG技术,让几万份文档瞬间变成智能助手,员工提问秒得答案,知识管理从此告别"大海捞针"!一、什么是RAG?为什么它这么强大?RAG技术解析RAG(Retrieval-Augmented Gene…- 0
- 0
-
检索增强生成(RAG):其架构、演进与变革性影响的全面解析
引言人工智能的范式转移近年来,大语言模型(LLM)的发展标志着人工智能领域的一次重大飞跃。然而,这些模型在很大程度上是“闭卷”系统,其能力完全依赖于其庞大参数中存储的知识 (1)。这种架构带来了固有的挑战,最突出的是知识的静态性和不可靠性。为了克服这些障碍,人工智能领域正在经历一场深刻的范式转移:从“闭卷”考试转向“开卷”考试。这种转变的核心是让大语言模型能够访问和利用外部的、动态的信息源进行推理…- 0
- 0
-
检索增强生成(RAG)技术的架构、工作流与实际应用
1 引言 在当今动态的商业环境中,检索增强生成(Retrieval-Augmented Generation, RAG)代表着AI模型处理复杂任务的革命性转变。通过将实时数据检索能力与先进文本生成技术相结合,RAG能够提升决策效率、自动化业务流程,并生成高度精准且具备上下文感知能力的响应。这种集成化方案为寻求在客户服务、内容创作、市场情报等领域拓展业务的企业提供了强有力的解决方案。 2 RAG的工…- 0
- 0
-
关于RAG和智能体的区别,从某方面来说智能体也是RAG的一种实现方式
“ 智能体和RAG技术有交集,但智能体功能更强,应用范围更广。”在大模型的应用场景中,RAG和智能体是其两个主要应用方向;在之前对RAG和智能体不够了解的时候,一直认为RAG技术和智能体技术完全是两个不同方向的应用场景。但随着对RAG和智能体认识的加深,现在发现RAG和智能体有一定的重合部分;记得之前在一篇文章中看到过,意思大概是基于大模型构建的应用,本质是一种数据增强技术,原因就在于大…- 0
- 0
-
响应速度提升300%、检索准确率90%:RAG如何让企业知识“活”起来赚钱?
响应速度提升 300%:RAG 如何激活企业知识价值?2025 年 Q2,某头部新能源车企客服中心出现反常现象:人工接线量下降 47%,客户满意度却提升 22%。背后秘密在于 6 个月前上线的 RAG(检索增强生成)智能客服系统 —— 过去需人工翻查 5 份手册、耗时 15 分钟的售后问题,现在 AI 能直接调取最新维修手册和零部件库存数据,3 秒内给出解决方案。这不是个例。Gartner《202…- 0
- 0
-
关于在RAG检索增强中文档处理的解决方案——针对中小企业
“ RAG技术成本最低的方式就是把非结构化文档转换成markdown格式进行处理 。”在大模型应用领域中——RAG技术应该属于一项基础技术,不论做什么业务基本都离不开RAG的存在;但RAG技术属于典型的入门五分钟,想做好却需要花费大量时间和精力,以及成本。所以,今天我们就来讨论一下RAG技术在企业应用中的解决方案,既要考虑技术问题,也要考虑成本问题。怎么做好RAGRAG技术从整体上来说主…- 0
- 0
-
RAG与MenoBase长期记忆:让AI从“短期记忆”走向“深度认知”的进化之路
在人工智能技术快速迭代的今天,大语言模型(LLM)的能力边界不断被突破,但一个长期困扰行业的问题始终存在:当用户与AI对话时,模型往往“记不住过去”——上一轮提到的关键信息下一轮就遗忘,复杂任务需要反复重复背景,个性化交互更是难以实现。这种“短期记忆”的局限,让AI始终像一位“健忘的专家”,知识渊博却难以建立深度连接。为了解决这一问题,检索增强生成(RAG)与长期记忆系统(如MenoBase)的结…- 0
- 0
-
RAG 应用进阶指南:别再“一次性”加载了!教你构建可分离、可维护的动态 AI 知识库
还在用脚本一次性跑完 RAG 流程?太 Low 了!本教程带你将数据处理与 AI 应用彻底解耦。你将学会:1) 建立一个独立的“数据中心”,随时增删改查你的知识。2) 让 RAG 应用加载指定知识库。Github: https://github.com/langchain-ai/langchain嘿,各位 AI 架构师和探索者!你们是否成功用 LangChain 搭建了你的第一个 RAG 应用?很…- 0
- 0
-
学习 RAGFlow 知识库高级配置
目前为止,我们已经学习了很多关于 RAGFlow 的知识库配置,包括分块方法,PDF 解析器,嵌入模型,RAPTOR 策略,提取知识图谱等,除此之外,还剩下一些高级配置,我们今天一起来看下:页面排名当我们从多个指定的知识库中检索知识时,可能希望某些知识库的知识优先被检索到。比如我们有两个知识库:知识库 A 用于 2024 年新闻,知识库 B 用于 2025 年新闻,但希望优先显示 2025 年的新…- 0
- 0
-
Agentic Workflow——RAGFlow 0.20.0 特性预览
从 Workflow 到 Agentic Workflow经历了较长时间的等待,RAGFlow 0.20.0 版本终于发布,这是一个里程碑式的版本,因为它代表 RAGFlow 在 RAG/Agent 的拼图终于完整。在一年前的此时,RAGFlow 推出了 Agent 特性,但在当时这只包含 Workflow ,并没有提供 Agentic Workflow 的编排能力,因此不是完整体的 Agent …- 0
- 0
-
E²GraphRAG:图结构 RAG 的效率 “加速器”
“ E²GraphRAG 框架,直击图结构 RAG 方法效率瓶颈。其在索引阶段构建摘要树与实体图双结构,检索阶段采用自适应策略动态选择检索模式,实现索引速度较 GraphRAG 提升 10 倍,检索速度较 LightRAG 提升 100 倍的突破,为高效智能检索开辟新路径。” 大家好,我是肆〇柒。大型语言模型(LLM)在自然语言处理(NLP)任务中广泛应用,但存在幻觉问题和领域…- 0
- 0
-
RAG的五种分块策略
RAG 是将附加文档存储为嵌入向量,将传入的查询计算向量与这些向量进行匹配,并将最相似的信息与查询一起提供给LLM的过程。由于附加文档可能非常大,流程的步骤1还需要分块,将大文档分成较小/方便管理的文本块,RAG的分块策略主要有五种,分别是固定大小分块、语义分块、递归分块、基于文档结构的分块、基于LLM的分块。固定大小的分块固定大小的分块是最直观和直接的方法,根据预定数量的字符、单词或标记将文本分…- 0
- 0
-
关于RAG检索增强的右侧优化方案——企业级应用中怎么提升RAG的检索准确度
“ RAG最终的评判标准只有一个——召回精度,RAG所有的技术都是围绕着怎么更快更准确的召回数据。”RAG增强检索的核心指标只有一个——召回准确率;对于RAG技术来说,最重要的事情就是其召回数据的准确性;而怎么提升其召回准确率,方法只有两个,一个是左侧增强,一个是右侧增强。所谓的左侧增强就是文档处理处理,怎么更好的处理复杂文档;而右侧增强就是召回侧的召回策略。今天,我们就来讨论一下RAG…- 0
- 0
-
在RAG中文档处理质量参差不齐的情况下——提升召回精度的企业级解决方案
“ RAG做起来很简单,但想把RAG做好就需要想尽办法去提升数据的召回质量。”在RAG中文档处理可以说是一个重难点,特别是复杂文档的处理更是一言难尽;因此,面对这种现实问题,总不能直接摆烂,因此怎么在文档质量处理参差不齐的情况下,提升RAG的召回精度就是一个需要解决的问题。文档处理的质量直接影响到RAG的召回效率,但目前文档处理是一个难点;因此怎么基于现有条件,提升RAG的召回精度?既然…- 0
- 0
-
再学 RAGFlow 的文件解析逻辑
经过几天的学习,我们了解了 RAGFlow 的文件上传和解析流程,了解了解析任务是如何触发并放入 Redis Stream 消息队列中,等待任务执行器消费和处理的。今天我们将继续学习任务执行器中最重要的函数 do_handle_task() 的实现,看看 RAGFlow 是如何具体执行每个解析任务的。do_handle_task 函数实现do_handle_task&…- 0
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页

联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!
























