全部标签

RAG技术

RAG、LangChain、Agent 到底有啥关系？

RAG、LangChain、Agent三者的关系图然后用一句话来概括这张图: 你可以在LangChain框架中使用RAG技术来创建一个Agent，扮演特定的角色专门解决用户的特定需求。接下来我们按顺序介绍这三个名词。RAG（检索增强生成）：知识增强外挂 RAG(Ret…
RAG技术
- 3
- 0
charles25年5月7日
RAG – prompt

引言LLM 大语言模型，可以这么理解，假设人脑是可以置空的，还可以无损复制。某天获取一个置空的人脑，保留人脑中的神经元，不断用数据去训练它，让它知道数据之间的关系，并把这种关系记录到神经元网络中。等到训练完成，把它从训练器上取下来，无限复制。通上电，他说话，它就能理解，并且基于自己大脑中的知识，做出回答。不过，它的知识会局限于训练时用到的数据，如果你问它此时此刻发生的事情，它是没法回答你的。这时，…
RAG技术
- 2
- 0
charles25年5月7日
BM25算法基本使用以及在RAG中的应用

概述BM25算法被多种RAG开源框架和向量库的向量查询中提到或使用到。本文介绍BM25算法的基本原理，并通过一个可运行的例子来说明如何使用BM25算法。BM25（Best Match 25）是一种用于信息检索的概率模型，常用于搜索引擎和问答系统中。在RAG（Retrieval-Augmented Generation）框架中，BM25用于从大规模文档库中检索与查询最相关的文档。BM25基于词频（T…
RAG技术
- 8
- 0
charles25年5月7日
TrustRAG：为AI知识检索打造更安全的防线

1. 问题：RAG系统的隐形威胁检索增强生成（RAG）系统通过整合外部知识大幅提升了大型语言模型（LLM）的准确性和上下文相关性。然而，RAG系统存在一个重大漏洞：语料中毒攻击。攻击者通过注入恶意文档，让模型在生成时输出错误或有害内容。例如，生成错误代码或传播虚假信息的案例屡见不鲜，这不仅威胁了模型的可靠性，还可能引发现实世界的损失。TrustRAG正是为了解决这一问题而提出的，它通过一套双阶段的…
RAG技术
- 7
- 0
charles25年5月7日
DeepSeek+RAGFlow 本地部署避坑指南，一文搞定常见难题！

家人们，最近技术圈可热闹了，不少小伙伴都投身到 DeepSeek 结合 RAGFlow 的本地部署中，满心期待着打造出专属的智能小助手。但理想很丰满，现实却很骨感，部署路上那可是状况百出，各种难题让人焦头烂额。别担心，今天这篇文章就来给大家打一剂 “强心针”，把这些问题一次性解决，让你的部署之路畅通无阻?。在这之前，先带大家看看 DeepSeek+RAGFlow 本地部…
RAG技术
- 2
- 0
charles25年5月7日
基于DeepSeek的本地化知识库 RAGFlow 搭建(附带镜像链接)

DeepSeek部署完后，除了正常的聊天使用，实际上更想基于它做一些更符合预期的事情，比如基于某些事实或者数据，能给我推理出来相关的结果或者尽量限制在某一部分进行回答，这个比较突出的表现方式就是知识库，其中，最新最新出来的开源 RAGFlow 很不错，这就部署出来瞅一下。当然，DeepSeek的部署就需要参考《基于Ubuntu Ollama 部署 DeepSeek-R132B 聊天大模…
RAG技术
- 6
- 0
charles25年5月7日
RAGFlow+DeepSeek-R1:14b落地案例分享（足够详细）：机加工行业设备维保场景

看到一个段子说，春节开工以后，中国有 5000 万家企业老板担心会错过 DeepSeek。虽然感觉有点瞎玩梗，但 DeepSeek 无疑已是当下所谓大模型企业应用落地的"房间里的大象"。不过想想，其实子弹也才刚刚飞了一个月而已。但 DeepSeek R1 这波多尺寸开源，属实是解锁了更多中小微企业做本地部署的可能性。而其中RAG 无疑又是一个主流且首当其冲的方法。过去两周以来，…
RAG技术
- 5
- 0
charles25年5月7日
DeepRAG：LLM时代的智能检索革命（实测提升准确率21.99%）

隔壁实验室的博士生小李同学在大半夜还盯着屏幕，模型日志疯狂滚动。他的研究对象——最新的大语言模型（LLM）——刚刚生成了一段自信满满却漏洞百出的答案。他苦笑了一下，关掉了对话框。“这不对啊。”他揉了揉太阳穴，想起了最近被炒得火热的“RAG”技术——用外部知识库来增强大模型的准确性。可惜，现有的方案在检索时太过死板，获取的信息往往冗余，甚至会干扰原本的推理逻辑。就在这时，他无意间点开了一…
RAG技术
- 5
- 0
charles25年5月7日
从零开始优化 RAG 流程的终极指南，解决检索增强生成的核心挑战

RAG 工作流程划分首先，我们将 RAG 工作流程分为三个部分，以增强我们对 RAG 的理解，并优化每个部分以提高整体性能：预检索在预检索步骤中，需要准备LLM 原始训练数据集之外的新数据（也称为外部数据），并将其拆分成块，然后使用向量模型对块数据进行索引，该模型将数据转换为数值表示并将其存储在向量数据库中,此过程创建了 LLM 可以理解的知识库。RAG 中的预检索检索在最重要的检索步骤中，用户…
RAG技术
- 10
- 0
charles25年5月7日
本地运行DeepSeek R1 + RAG系统

本地运行DeepSeek R1 + RAG系统基本概念? OllamaOllama 是一个用于在计算机上本地运行大型语言模型（）LLMs 的框架。它允许您下载、运行 AI 模型并与之交互，而无需基于云的 API。? 示例： ollama run deepseek-r1：1.5b – 在本地运行 DeepSe…
RAG技术
- 3
- 0
charles25年5月7日
传统分块已死？Agentic Chunking拯救语义断裂，实测RAG准确率飙升40%，LLM开发者必看！

最近公司处理LLM项目的同事咨询了我一个问题：明明文档中多次提到同一个专有名词，RAG却总是漏掉关键信息。排查后发现，问题出在传统的分块方法上——那些相隔几页却密切相关的句子，被无情地拆散了。我给了一些通用的建议，比如使用混合检索代替单一的语义检索，基于chunk生成QA对等等。接着他又提出了一个问题，有没有通过分块技术能减少这类问题的发生？我说你也可以试试最近新提出的一种分块策略：Agentic…
RAG技术
- 1
- 0
charles25年5月7日
传统 RAG 与 Agentic RAG对比

1. 传统 RAG 的困境2. Agentic RAG 的创新突破3. Agentic RAG 的优势与应用前景在人工智能快速发展的当下，大语言模型（LLM）技术取得了显著进步，但也面临诸多挑战。检索增强生成（RAG）技术应运而生，为提升语言模型性能提供了新途径。不过，传统 RAG 存在一定局限，而 Agentic RAG 则试图突破这些瓶颈，带来更强大的功能体验。本文将探究二者的差异。1. 传统…
RAG技术
- 6
- 0
charles25年5月7日
企业级内部的RAG系统，已经支持DeepSeek,PHP语言，可以做内部网的RAG

大型企业将内部网站通过基于大模型的RAG（检索增强生成）系统进行升级和优化，可以带来多方面的好处。以下是详细的分析：1. 提升信息准确性与实时性知识融合与更新：RAG系统通过从外部知识库中检索相关信息，并将其与语言模型的生成能力结合，可以显著提升生成答案的准确性。对于大型企业而言，这意味着内部网站上的信息将更加准确，减少错误信息的传播。实时性：RAG系统允许从外部数据源实时检索信息，如最新的政策文…
RAG技术
- 5
- 0
charles25年5月7日
尊敬的 IT 部门，请停止尝试构建自己的 RAG

想想看，我们大多数企业机会不会自己构建CRM 系统或自定义 ERP— 或者在大多数情况下，不会自己构建LLM。你们会吗？然而，我看到 IT 部门到处都在说服领导者，建立自己的基于 RAG 的聊天工具会有所不同。事实并非如此。大多数，情况会更糟。让我给你描绘一下：上周，我观看了一支技术实力很强的工程师团队演示他们崭新的 RAG 管道。全部由内部开发。他们感到自豪。他们很兴奋。他们有向量嵌入！他们有快…
RAG技术
- 5
- 0
charles25年5月7日
RAG+的一些前沿动向：兼看长文本、投标写作以及R1可解释性的有趣探索

我们来看看最近的一些有趣的点，基本的认知，供大家一起参考。围绕Ktransformer认知误区，长文本新策略工作，投标文件写作项目，RAG输入去噪，RAG–R1结合，秘塔浅层搜索思路。社区例行项目，供大家一起参考。专题化，体系化，会有更多深度思考。大家一起加油。一、关于RAG+的一些进展 1、RAG+R1结合进展r1-reasoning-rag：结合R1推理+递归式RAG，sing deepsee…
RAG技术
- 9
- 0
charles25年5月7日
基于SC-Telco RAG技术的通信标准知识问答

编者荐语本文介绍了SC-Telco RAG技术通过结构化文档知识提取和针对问答任务的微调，显著提升了大语言模型在通信知识问答领域中的问答准确性。期望能为关注该领域的读者带来思路共鸣和实践启发。本文已被IEEE国际旗舰会议GLOBECOM接收。基于SC-Telco RAG技术的通信标准知识问答亚信科技（中国）有限公司摘要：大语言模型（LLMs）在知识问答领域表现出了卓越的语言理解和生成能力…
RAG技术
- 6
- 0
charles25年5月7日
玩转 Deepseek-R1 本地部署+知识库搭建+多轮RAG，保姆级教程！

最近，深度求索开源的 DeepSeek-R1 系列模型火遍全球，但因为“服务器繁忙”劝退不少人。为了解决这个问题，我们将以 UltraRAG 框架为例，为大家介绍 DeepSeek-R1 的本地部署流程，同时带领大家熟悉 UltraRAG 的细节和功能。在成功跑通 VanillaRAG 后，我们还简单尝试了在 DeepSeek-R1 加持下的 Adaptive-Note，提出法律领域的问题，效果居…
RAG技术
- 6
- 0
charles25年5月6日
DeepSeek R1模型的“幻觉”问题与企业级应用的破局之道

年初以来，DeepSeek R1模型以其卓越的推理能力备受关注。然而，“幻觉”仍旧是当前大语言模型无法避免的问题。人们一度认为，随着大模型推理能力的提升，将极大提升回答的准确性，从而减少“幻觉”现象。事与愿违，尽管 DeepSeek R1 模型在推理能力上的表现令人瞩目，但却呈现出更高的幻觉率。根据 Vectara 团队 HHEM 人工智能幻觉测试的结果，DeepSeek R1 的幻觉率高达 14…
RAG技术
- 4
- 0
charles25年5月6日
Ragflow应用小试牛刀

背景 Ragflow（RAGFlow）是一款基于深度文档理解的开源检索增强生成（Retrieval-Augmented Generation，RAG）引擎。以下是对Ragflow的详细介绍：一、核心特性深度文档理解：Ragflow具备从复杂格式的非结构化数据中精准提取知识的能力，能够在海量数据中定位关键内容，提升信息检索的准确性。它支持多种文档格式，如Word、…
RAG技术
- 5
- 0
charles25年5月6日
AI是 0，数据是 1

AI 技术再怎么飞速发展，也逃不脱工具类技术的宿命：落地应用时需要数据输入。不管是人工录入、API 接口获取还是文档提取，总要有这样一步“Input”作为前提，而往往就是这一步，扼住了技术落地的喉咙。1. 专家 = 数据 + 经验我们常把 AI 比作专家，期望 AI 可以充当一 7×24h 不眠不休、随叫随到的专家。我们在训练模型或创建知识库时，也是通过撰写固化的问题答案对，来模拟专家经验的，但问…
RAG技术
- 4
- 0
charles25年5月6日
RAG前沿进展：多抽象层级chunk及对齐机制的ARM实现思路

我们继续来看RAG，来看看引入多层级粒度chunk的RAG方案，主要应对chunk切分的问题；一个是针对问题分解，引入对齐机制的ARM方案。读读看，都会有收获。专题化，体系化，会有更多深度思考。大家一起加油。一、引入多抽象层级chunk粒度的RAG方案现有RAG的方法通常依赖于固定长度的块(chunk) 来支持问答，这可能导致信息的片段化和不完整性；检索过多的信息可能导致 “中间迷失” 问题，并…
RAG技术
- 7
- 0
charles25年5月6日
如何从网关层降低 AI 的调用成本

《Higress AI 网关挑战赛》正在火热进行中，Higress 社区邀请了目前位于排行榜 top5 的选手杨贝宁同学分享他的心得。下面是他整理的参赛攻略：背景我们要在 Higress 网关中编写 WebAssembly（wasm）插件，使得在 http 请求的各个阶段（requestHeader，requestBody，responseHeader，responseBody）能够将…
RAG技术
- 8
- 0
charles25年5月6日
推荐一个企业级知识图谱增强的检索增强生成(RAG)的项目

介绍Microsoft GraphRAG 是一个开源项目，旨在利用 Microsoft Graph 的强大功能构建企业级的知识图谱增强的检索增强生成（RAG）方案。简单来说，它将企业内部的各种数据源（如邮件、文档、日历、联系人等）通过 Microsoft Graph 连接起来，形成一个结构化的知识图谱，然后利用这个知识图谱来增强 RAG 系统的检索能力，从而提升大语言模型（LLM）在企业应用中的问…
RAG技术
- 12
- 0
charles25年5月6日
用Ollama+RAGflow打造私有知识库

1. Ollama 简介 https://ollama.comOllama 是一个本地运行的大语言模型（LLM）工具平台，允许用户在本地设备上运行和管理大模型，而无需依赖云服务。它支持多种开源模型，并提供了用户友好的接口，非常适合开发者和企业使用。安装 Ollama首先，从 Ollama 官网下载安装包，并按照提示完成安装。启动OllamaWindows下搜索ollama，然…
RAG技术
- 9
- 0
charles25年5月6日