全部标签

新闻资讯

如何为 RAGFlow 添加新的数据源

本指南面向希望为 RAGFlow 扩展数据源能力的社区开发者，旨在以专业、可复用的流程说明如何实现并接入新的 connector。RAGFlow 的 connector 框架深受 Onyx 开源项目启发，特此致谢。在实际使用中，除了从本地文件系统导入文件，RAGFlow 还需要从大量异构系统中获取数据。为此，引入了统一的 datasource / connector …
RAG技术
- 1
- 0
charles4月9日
为什么RDF是AI系统的“天然知识层”？

当企业用LLM处理数据时，总会遇到同样的困境：AI给出的答案自信却错误，对基础事实产生幻觉，无法关联不同系统的信息。而破局的关键，藏在一个被很多人忽视的技术里——RDF。它不是众多知识图谱方案中的“可选之一”，而是知识表示的“天然终点”。一、知识层革命：让LLM准确率翻3倍的秘密你的AI在和数据“打架”？这不是个例。当大语言模型试图用企业SQL数据库回答业务问题时，错误率居高不下——没有额外的上下…
RAG技术
- 0
- 0
charles4月9日
Google 让 RAG 变得前所未有地简单：全新 File Search 工具震撼登场

如果你曾尝试自己搭一套 RAG（Retrieval-Augmented Generation，检索增强生成），你大概懂那种痛：要管理 embeddings（向量嵌入）、vector databases（向量数据库）、把文本正确地 chunking（切分），还得确保一切能和你的模型顺畅协作、又不至于烧钱。好吧，Google 直接把这摊麻烦全给你搞没了。他们悄悄地在 Gemini API 里_推出了全…
RAG技术
- 0
- 0
charles4月9日
从答案到洞察：Structured RAG正在重塑企业知识库的底层逻辑

• 传统RAG的分析瓶颈：在处理需要聚合、比较或全面筛选的企业级复杂查询时，基于向量检索的传统RAG（检索增强生成）系统在准确性和完整性上存在固有局限。• Structured RAG (S-RAG) 范式：S-RAG提出了一种新方法，在离线阶段将非结构化文档预处理，提取信息并构建成结构化数据库。• 查询即代码：在响应用户请求时，S-RAG将自然语言问题转…
RAG技术
- 0
- 0
charles4月8日
RAG Chunking 2.0：提升文档分块效果的一些经验

在基于大语言模型的RAG系统里，文本分块是非常关键的一步。分块做得好，后续的向量检索、结果召回和生成质量都会更稳更准。除了大家常用的固定大小、递归、语义、按文档等切法，至少还有好几种策略，能显著提升检索准确率、保持上下文连续，并适配不同任务。1. 滑动窗口分块概念首先设定一个固定大小的窗口，再按设定的重叠量向前滑动，生成一系列重叠块，这样跨块边界的上下文更不容易丢。使用场景适合追踪长文档里的「进展…
RAG技术
- 0
- 0
charles4月8日
RAGFlow v0.22.0 发布：数据源同步、变量聚合、全新管理界面与多项重大更新

2025年11月12日，RAGFlow 正式发布 v0.22.0 版本。本次更新带来了大量功能增强、架构优化及重要修复，涵盖数据集管理、智能代理、解析管线、管理界面及模型支持等方面。同时，本版本在镜像发布策略和功能上也进行了重要调整。以下为详细更新内容：一、重大变更• 从本版本起，仅提供精简版（不含嵌入模型）Docker 镜像，镜像标签中不再追加 -slim 后缀。…
RAG技术
- 1
- 0
charles4月8日
RAG实战(一)：Simple RAG篇

接下来带来一套RAG实战教程，涵盖各类RAG场景，教程代码均为Python版，保守预计文章30篇+。本篇是第一篇最简单的RAG示例流程，文章中会贴出所有代码，但若想学的更方便，可通过知识星球获取完整项目代码。环境配置conda create -n rag-learning python = 3.10.0source activate rag-learning安装依赖 requirements.tx…
RAG技术
- 1
- 0
charles4月8日
5步构建企业级RAG应用：Dify与LangChain v1.0集成实战

今天，我们将通过五个关键步骤，带您从零开始掌握dify与LangChain v1.0的集成技术，构建属于自己的企业级RAG应用。Dify核心功能解析：低代码开发的强大引擎Dify作为开源的LLM应用开发平台，其核心优势在于将复杂的AI工程能力封装为直观的可视化工具。在集成LangChain时，以下特性尤为关键：可视化工作流编排允许开发者通过拖拽节点构建复杂AI流程。Dify的Chatflow引擎支…
RAG技术
- 0
- 0
charles4月8日
从零实现一个简单的 RAG 系统

最近，检索增强生成（Retrieval-Augmented Generation，简称 RAG）在人工智能和大模型领域中崭露头角，成为一种极具潜力的新范式。RAG 将信息检索与文本生成相结合，通过引入外部知识源来提升大模型的表现。这种方法已在问答系统、对话系统以及内容生成等多种应用中展现出令人期待的成果。在这篇文章中，作者将带你深入了解 RAG 的工作原理，并使用 Python 和 Ollama …
RAG技术
- 0
- 0
charles4月8日
RAG 真的能“不暴露私有数据”吗？答案是：可以

你是否认真考虑过 RAG 流水线中的文档隐私？这篇文章也许能提供一个有帮助的方向。为什么“Standard RAG → Cloud Search”在隐私上行不通Standard RAG 的做法是把明文文档塞进 prompt。对于企业合同、病历或个人笔记等输入，这是完全不可行的——从设计上你就在暴露敏感数据。Parametric RAG (PRAG) 试图把知识“烘进”LoRA 权重，但在实践中碰上…
RAG技术
- 0
- 0
charles4月8日
RAG问答系统不准确？这份语料整理方法论帮你解决

要构建一个高准确率的RAG系统，首先需要解决的是语料数据的质量问题。"垃圾进，垃圾出"（Garbage In, Garbage Out），无论我们的算法多么先进，如果底层的语料数据质量不佳，系统的表现也会受到限制。无论我们的检索算法多么先进，大模型多么强大，如果底层的语料数据质量不佳，系统的表现必然会受到限制。我想和大家分享的一个观点：语料知识整理是…
RAG技术
- 0
- 0
charles4月8日
Dify x Oracle Database 26ai 深度集成，打造企业级 RAG 应用

Oracle 与 dify 携手推出深度集成方案，将 Oracle Database 26ai 的向量存储与检索能力，与 Dify 新推出的 Knowledge Pipeline 进行融合。通过这一集成，企业能够在统一的 Oracle 数据平台上同时管理业务数据与 AI 向量数据，利用 Oracle 的企业级可靠性、PB 级扩展能力与数据安全特性，快速构建基于私有数据的 RAG 检索与智能问答应用…
RAG技术
- 0
- 0
charles4月8日
从朴素 RAG 到 Agentic RAG的五阶段：静态线性流程升级为智能自主系统

大型语言模型（LLM）的爆发式发展，让AI具备了类人文本生成与复杂语言理解能力，但知识静态化与幻觉生成两大痛点始终制约其落地——LLM的知识局限于训练数据截止时间，且常生成无事实依据的内容。检索增强生成（Retrieval-Augmented Generation, RAG）技术应运而生，通过“外部知识检索+LLM生成”的融合模式，为LLM装上可更新的外挂知识库，成为解决上述痛点的核心方案。RAG…
RAG技术
- 0
- 0
charles4月8日
RAG处理长文本中的上下文复用思路及SmartResume简历解析系统方案

今天是2025年11月07日，星期五，北京，天气雨继续看技术进展，回到信息抽取，看SmartResume简历解析的一个简易系统，是一个典型的pipeline思路，看看具体怎么做的。另一个是还是RAG的问题，看看RAG在加速目标上，做的上下文复用思路。已经立冬了，2025年进入冬天了。多总结，多归纳，多从底层实现分析逻辑，会有收获。一、SmartResume简历解析的一个简易系统来看一个文档信息抽取…
RAG技术
- 0
- 0
charles4月8日
RAG已经过时了？试试CAG，缓存增强生成技术实战大揭秘！

不知道你有没有遇到这样的情况，AI客服每天要回答几千个问题，其中至少有三分之一是重复的——什么"年假怎么算""差旅费怎么报销""公积金比例是多少"……这些问题的答案其实都写在公司制度里，几个月都不会变一次。但问题来了：每次有人问，AI都要重新去文档库里翻一遍。就像你明明已经把家里钥匙放哪儿记得清清楚楚，但每次出门还是要把整个房间翻一遍才能…
RAG技术
- 0
- 0
charles4月8日
Zero-RAG，对冗余知识说“不”

一、LLM 越学越满，RAG 却越搬越重图 1：知识冗余示意图(a) Llama3.3-70B 在四个 Wikipedia 风格 QA 数据集上裸模型 Exact-Match 召回 ≥40%——说明近一半问题模型本来就会。(b) 把对应维基段落再送进上下文，准确率反而掉 20 分——冗余知识成了"噪声"。结论：外部 corpus 与模型内部知识高度重叠，继续"全量检索…
RAG技术
- 0
- 0
charles4月8日
RFT目前(在应用层)仍然是被低估的

一篇短文，刷新一下观点的有效期，没有新的观点。我在2025年Q1有一系列文章讨论我当时在RFT上的实践，和我对于RFT价值的看法。之后由于我跑去做别的了，所以没有再提RFT这边。但这并不代表说我不看好RFT了。目前整个应用层对于RFT的实践仍然似乎成功率不高，不过这更多是由于其infra要求更高，以及试用问题选择需要的认知更多，需要调节的超参数更多了。门比SFT窄得多。但作为目前少有的几大方案，R…
RAG技术
- 0
- 0
charles4月8日
从 RAG 到 Agentic RAG，再到 Agent Memory：AI 记忆的进化三部曲

当前AI交互的一个核心挑战是记忆的缺失。一个关键的范式转变，正引导AI从“只读”的知识检索，走向“读写”的动态记忆。这种“写入”能力，让AI得以从一个博学的工具，朝着能够铭记用户、共同成长的学习伙伴迈进。AI交互中的“瞬时记忆”挑战与AI助手的互动中，我们常会遇到一种“健忘”的体验。精心传授的偏好、反复提及的背景信息，在下一次对话中可能荡然无存。这种交互的断裂感，源于多数AI系统在设计…
RAG技术
- 0
- 0
charles4月8日
万字详解Naive RAG超进化之路：Pre-Retrieval和Retrieval优化

之前两篇文章介绍了一个最最最简单版本的RAG，它的思路简洁优雅，只是在落地的时候，每个步骤都可能会出错，导致效果比较“骨感”，被学术界归类为“Naive RAG”。那还有一个非常重要的问题是，既然RAG的思维没有什么问题，那到底应该怎么做呢？！我们需要做怎样的修改，才能让RAG从“too young too simple”进化到“可以在真实的生产环境中落地”呢？Naive RAG每个可能出错的环节…
RAG技术
- 0
- 0
charles4月8日
别只调模型！RAG 检索优化真正该测的，是这三件事

当面试官问：“RAG 的检索模块怎么优化？” 很多测试工程师的第一反应是：“那不是算法同学的活儿吗？”其实不然。 RAG（Retrieval-Augmented Generation）的检索模块，决定了系统回答的准确性、性能稳定性，以及整个优化链路能否被量化与验证。而这，恰恰是测试开发最擅长发力的地方。一、RAG 检索模块到底在干嘛？简单来说，RAG 是“先检索，再生成”：用户提问后，系统先去…
RAG技术
- 0
- 0
charles4月8日
大模型生态的“不可能三角”：规模化应用的架构困境？

导读传统“单一模型包打天下”的架构范式，在真实的产业环境中面临着难以调和的系统性矛盾。这一矛盾集中体现在三个相互制约的维度上，构成了大模型应用的“不可能三角”，RAG架构的提出，正是对这一“不可能三角”的系统性破解，其本质并非简单的功能增强，而是一次深刻的“知识架构范式革命。···★本文为对RAG（检索增强生成）进行技术全景解析的系列文章中的第三篇我们习惯于将“大模型”视为…
RAG技术
- 0
- 0
charles4月8日
Dify知识库从Demo到生产：RAG构建企业级私有知识库的7个关键步骤

dify知识库从Demo到生产：RAG构建企业级私有知识库的7个关键步骤引言：当大模型遇见"失忆"困境2025年的一个普通工作日，外卖客服系统突然收到大量用户投诉："为什么我的退款3天了还没到账？"。后台日志显示，智能客服给出的答复是"退款将在3-5个工作日原路返回"，但实际政策早已调整为"1个工作日内返还至账户余额…
RAG技术
- 0
- 0
charles4月8日
RAGFlow 深度介绍

一、介绍RAGFlow 是一个基于深度文档理解的开源 RAG（检索增强生成）引擎。与 LLM 集成后，它能够提供真实的问答功能，并以来自各种复杂格式数据的可靠引用为支撑。RAGFlow 的安装是基于 Docker 的，具体的安装步骤可以直接参考官方使用文档或者仓库的 README文件，官方建议的配置是 16G 的内存、50G 的硬盘…
RAG技术
- 0
- 0
charles4月8日
RAG—Chunking策略实战｜得物技术

目录一、背景二、什么是分块（Chunking）三、为何要对内容做分块处理四、分块策略详解 1. 基础分块 2. 结构感知分块 3. 语义与主题分块 4. 高级分块 5. 混合分块五、结论一背景在 RAG 系统中，即便采用性能卓越的 LLM 并反复打磨 Prompt，问…
RAG技术
- 0
- 0
charles4月8日