-
如何为 RAGFlow 添加新的数据源
本指南面向希望为 RAGFlow 扩展数据源能力的社区开发者,旨在以专业、可复用的流程说明如何实现并接入新的 connector。RAGFlow 的 connector 框架深受 Onyx 开源项目启发,特此致谢。在实际使用中,除了从本地文件系统导入文件,RAGFlow 还需要从大量异构系统中获取数据。为此,引入了统一的 datasource / connector …- 1
- 0
-
为什么RDF是AI系统的“天然知识层”?
当企业用LLM处理数据时,总会遇到同样的困境:AI给出的答案自信却错误,对基础事实产生幻觉,无法关联不同系统的信息。而破局的关键,藏在一个被很多人忽视的技术里——RDF。它不是众多知识图谱方案中的“可选之一”,而是知识表示的“天然终点”。一、知识层革命:让LLM准确率翻3倍的秘密你的AI在和数据“打架”?这不是个例。当大语言模型试图用企业SQL数据库回答业务问题时,错误率居高不下——没有额外的上下…- 0
- 0
-
Google 让 RAG 变得前所未有地简单:全新 File Search 工具震撼登场
如果你曾尝试自己搭一套 RAG(Retrieval-Augmented Generation,检索增强生成),你大概懂那种痛:要管理 embeddings(向量嵌入)、vector databases(向量数据库)、把文本正确地 chunking(切分),还得确保一切能和你的模型顺畅协作、又不至于烧钱。好吧,Google 直接把这摊麻烦全给你搞没了。他们悄悄地在 Gemini API 里_推出了全…- 0
- 0
-
从答案到洞察:Structured RAG正在重塑企业知识库的底层逻辑
• 传统RAG的分析瓶颈:在处理需要聚合、比较或全面筛选的企业级复杂查询时,基于向量检索的传统RAG(检索增强生成)系统在准确性和完整性上存在固有局限。• Structured RAG (S-RAG) 范式:S-RAG提出了一种新方法,在离线阶段将非结构化文档预处理,提取信息并构建成结构化数据库。• 查询即代码:在响应用户请求时,S-RAG将自然语言问题转…- 0
- 0
-
RAG Chunking 2.0:提升文档分块效果的一些经验
在基于大语言模型的RAG系统里,文本分块是非常关键的一步。分块做得好,后续的向量检索、结果召回和生成质量都会更稳更准。除了大家常用的固定大小、递归、语义、按文档等切法,至少还有好几种策略,能显著提升检索准确率、保持上下文连续,并适配不同任务。1. 滑动窗口分块概念首先设定一个固定大小的窗口,再按设定的重叠量向前滑动,生成一系列重叠块,这样跨块边界的上下文更不容易丢。使用场景适合追踪长文档里的「进展…- 0
- 0
-
RAGFlow v0.22.0 发布:数据源同步、变量聚合、全新管理界面与多项重大更新
2025年11月12日,RAGFlow 正式发布 v0.22.0 版本。本次更新带来了大量功能增强、架构优化及重要修复,涵盖数据集管理、智能代理、解析管线、管理界面及模型支持等方面。同时,本版本在镜像发布策略和功能上也进行了重要调整。以下为详细更新内容:一、重大变更• 从本版本起,仅提供精简版(不含嵌入模型)Docker 镜像,镜像标签中不再追加 -slim 后缀。…- 1
- 0
-
RAG实战(一):Simple RAG篇
接下来带来一套RAG实战教程,涵盖各类RAG场景,教程代码均为Python版,保守预计文章30篇+。本篇是第一篇最简单的RAG示例流程,文章中会贴出所有代码,但若想学的更方便,可通过知识星球获取完整项目代码。环境配置conda create -n rag-learning python = 3.10.0source activate rag-learning安装依赖 requirements.tx…- 1
- 0
-
5步构建企业级RAG应用:Dify与LangChain v1.0集成实战
今天,我们将通过五个关键步骤,带您从零开始掌握dify与LangChain v1.0的集成技术,构建属于自己的企业级RAG应用。Dify核心功能解析:低代码开发的强大引擎Dify作为开源的LLM应用开发平台,其核心优势在于将复杂的AI工程能力封装为直观的可视化工具。在集成LangChain时,以下特性尤为关键:可视化工作流编排允许开发者通过拖拽节点构建复杂AI流程。Dify的Chatflow引擎支…- 0
- 0
-
从零实现一个简单的 RAG 系统
最近,检索增强生成(Retrieval-Augmented Generation,简称 RAG)在人工智能和大模型领域中崭露头角,成为一种极具潜力的新范式。RAG 将信息检索与文本生成相结合,通过引入外部知识源来提升大模型的表现。这种方法已在问答系统、对话系统以及内容生成等多种应用中展现出令人期待的成果。在这篇文章中,作者将带你深入了解 RAG 的工作原理,并使用 Python 和 Ollama …- 0
- 0
-
RAG 真的能“不暴露私有数据”吗?答案是:可以
你是否认真考虑过 RAG 流水线中的文档隐私?这篇文章也许能提供一个有帮助的方向。为什么“Standard RAG → Cloud Search”在隐私上行不通Standard RAG 的做法是把明文文档塞进 prompt。对于企业合同、病历或个人笔记等输入,这是完全不可行的——从设计上你就在暴露敏感数据。Parametric RAG (PRAG) 试图把知识“烘进”LoRA 权重,但在实践中碰上…- 0
- 0
-
RAG问答系统不准确?这份语料整理方法论帮你解决
要构建一个高准确率的RAG系统,首先需要解决的是语料数据的质量问题。"垃圾进,垃圾出"(Garbage In, Garbage Out),无论我们的算法多么先进,如果底层的语料数据质量不佳,系统的表现也会受到限制。无论我们的检索算法多么先进,大模型多么强大,如果底层的语料数据质量不佳,系统的表现必然会受到限制。我想和大家分享的一个观点:语料知识整理是…- 0
- 0
-
Dify x Oracle Database 26ai 深度集成,打造企业级 RAG 应用
Oracle 与 dify 携手推出深度集成方案,将 Oracle Database 26ai 的向量存储与检索能力,与 Dify 新推出的 Knowledge Pipeline 进行融合。通过这一集成,企业能够在统一的 Oracle 数据平台上同时管理业务数据与 AI 向量数据,利用 Oracle 的企业级可靠性、PB 级扩展能力与数据安全特性,快速构建基于私有数据的 RAG 检索与智能问答应用…- 0
- 0
-
从朴素 RAG 到 Agentic RAG的五阶段:静态线性流程升级为智能自主系统
大型语言模型(LLM)的爆发式发展,让AI具备了类人文本生成与复杂语言理解能力,但知识静态化与幻觉生成两大痛点始终制约其落地——LLM的知识局限于训练数据截止时间,且常生成无事实依据的内容。检索增强生成(Retrieval-Augmented Generation, RAG)技术应运而生,通过“外部知识检索+LLM生成”的融合模式,为LLM装上可更新的外挂知识库,成为解决上述痛点的核心方案。RAG…- 0
- 0
-
RAG处理长文本中的上下文复用思路及SmartResume简历解析系统方案
今天是2025年11月07日,星期五,北京,天气雨继续看技术进展,回到信息抽取,看SmartResume简历解析的一个简易系统,是一个典型的pipeline思路,看看具体怎么做的。另一个是还是RAG的问题,看看RAG在加速目标上,做的上下文复用思路。已经立冬了,2025年进入冬天了。多总结,多归纳,多从底层实现分析逻辑,会有收获。一、SmartResume简历解析的一个简易系统来看一个文档信息抽取…- 0
- 0
-
RAG已经过时了?试试CAG,缓存增强生成技术实战大揭秘!
不知道你有没有遇到这样的情况,AI客服每天要回答几千个问题,其中至少有三分之一是重复的——什么"年假怎么算""差旅费怎么报销""公积金比例是多少"……这些问题的答案其实都写在公司制度里,几个月都不会变一次。但问题来了:每次有人问,AI都要重新去文档库里翻一遍。就像你明明已经把家里钥匙放哪儿记得清清楚楚,但每次出门还是要把整个房间翻一遍才能…- 0
- 0
-
Zero-RAG,对冗余知识说“不”
一、LLM 越学越满,RAG 却越搬越重图 1:知识冗余示意图(a) Llama3.3-70B 在四个 Wikipedia 风格 QA 数据集上裸模型 Exact-Match 召回 ≥40%——说明近一半问题模型本来就会。(b) 把对应维基段落再送进上下文,准确率反而掉 20 分——冗余知识成了"噪声"。结论:外部 corpus 与模型内部知识高度重叠,继续"全量检索…- 0
- 0
-
RFT目前(在应用层)仍然是被低估的
一篇短文,刷新一下观点的有效期,没有新的观点。我在2025年Q1有一系列文章讨论我当时在RFT上的实践,和我对于RFT价值的看法。之后由于我跑去做别的了,所以没有再提RFT这边。但这并不代表说我不看好RFT了。目前整个应用层对于RFT的实践仍然似乎成功率不高,不过这更多是由于其infra要求更高,以及试用问题选择需要的认知更多,需要调节的超参数更多了。门比SFT窄得多。但作为目前少有的几大方案,R…- 0
- 0
-
从 RAG 到 Agentic RAG,再到 Agent Memory:AI 记忆的进化三部曲
当前AI交互的一个核心挑战是记忆的缺失。一个关键的范式转变,正引导AI从“只读”的知识检索,走向“读写”的动态记忆。这种“写入”能力,让AI得以从一个博学的工具,朝着能够铭记用户、共同成长的学习伙伴迈进。AI交互中的“瞬时记忆”挑战与AI助手的互动中,我们常会遇到一种“健忘”的体验。精心传授的偏好、反复提及的背景信息,在下一次对话中可能荡然无存。这种交互的断裂感,源于多数AI系统在设计…- 0
- 0
-
万字详解Naive RAG超进化之路:Pre-Retrieval和Retrieval优化
之前两篇文章介绍了一个最最最简单版本的RAG,它的思路简洁优雅,只是在落地的时候,每个步骤都可能会出错,导致效果比较“骨感”,被学术界归类为“Naive RAG”。那还有一个非常重要的问题是,既然RAG的思维没有什么问题,那到底应该怎么做呢?!我们需要做怎样的修改,才能让RAG从“too young too simple”进化到“可以在真实的生产环境中落地”呢?Naive RAG每个可能出错的环节…- 0
- 0
-
别只调模型!RAG 检索优化真正该测的,是这三件事
当面试官问:“RAG 的检索模块怎么优化?” 很多测试工程师的第一反应是:“那不是算法同学的活儿吗?”其实不然。 RAG(Retrieval-Augmented Generation)的检索模块,决定了系统回答的准确性、性能稳定性,以及整个优化链路能否被量化与验证。 而这,恰恰是测试开发最擅长发力的地方。一、RAG 检索模块到底在干嘛?简单来说,RAG 是“先检索,再生成”: 用户提问后,系统先去…- 0
- 0
-
大模型生态的“不可能三角”:规模化应用的架构困境?
导读 传统“单一模型包打天下”的架构范式,在真实的产业环境中面临着难以调和的系统性矛盾。这一矛盾集中体现在三个相互制约的维度上,构成了大模型应用的“不可能三角”,RAG架构的提出,正是对这一“不可能三角”的系统性破解,其本质并非简单的功能增强,而是一次深刻的“知识架构范式革命。···★本文为对RAG(检索增强生成)进行技术全景解析的系列文章中的第三篇我们习惯于将“大模型”视为…- 0
- 0
-
Dify知识库从Demo到生产:RAG构建企业级私有知识库的7个关键步骤
dify知识库从Demo到生产:RAG构建企业级私有知识库的7个关键步骤引言:当大模型遇见"失忆"困境2025年的一个普通工作日,外卖客服系统突然收到大量用户投诉:"为什么我的退款3天了还没到账?"。后台日志显示,智能客服给出的答复是"退款将在3-5个工作日原路返回",但实际政策早已调整为"1个工作日内返还至账户余额…- 0
- 0
-
RAGFlow 深度介绍
一、介绍RAGFlow 是一个基于深度文档理解的开源 RAG(检索增强生成)引擎。与 LLM 集成后,它能够提供真实的问答功能,并以来自各种复杂格式数据的可靠引用为支撑。RAGFlow 的安装是基于 Docker 的,具体的安装步骤可以直接参考 官方使用文档 或者仓库的 README文件,官方建议的配置是 16G 的内存、50G 的硬盘…- 0
- 0
-
RAG—Chunking策略实战|得物技术
目录一、背景二、什么是分块(Chunking)三、为何要对内容做分块处理四、分块策略详解 1. 基础分块 2. 结构感知分块 3. 语义与主题分块 4. 高级分块 5. 混合分块五、结论一背 景在 RAG 系统中,即便采用性能卓越的 LLM 并反复打磨 Prompt,问…- 0
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页

联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!























